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理解 Unix 编程 


XT Unix 

写作 本 书 的 目的 是 解释 Unix 的 工作 原理 以 及 如 何 编写 Unix 系统 程序 。Unix 诞生 30 
年 来 ,至 邻 仍 在 进行 着 不 断 的 改进 ,并 朋 变 得 越 来 越 复杂 。 但 它 并 未 因此 而 难以 理解 ,最 初 
的 基本 结构 和 设计 原则 仍然 适用 。 通 过 理解 它 的 结构 .原理 和 历史 ,读者 可 以 阅读 、 扣 强 和 
增添 不 断 积 累 起 来 的 巨大 的 Unix 程序 库 。 同 时 ,在 这 个 过 程 中 ,相信 读者 也 可 以 感受 到 许 
多 乐趣 

为 了 使 讲解 更 加 清晰 明了 , 书 中 采用 了 阁 片 .类 推 、 伪 代码 . 源 代码 实验、 练习 和 特性 点 
等 多 种 形式 。 而 且 这 些 讲解 内 容 都 是 从 实际 的 问题 和 项 目 中 提炼 出 来 的 ， 





”本 书 的 适用 对 象 

阅读 本 书 的 读者 要 有 一 定 的 CC 语言 基础 。 如 果 已 经 学 过 C++ ,理解 书 中 的 代码 将 会 更 
加 容易 ,并 会 很 快 适应 本 书 。 读者 应 该 了 解数 组 结构、 指针 和 链表 的 概念 ,并 具有 用 它们 阅 
读 和 编 气 程序 的 能 力 ， 

但 这 里 并 不 要 求 读 者 用 过 Unix, 也 不 要 求 读 者 了 解 操作 系统 的 内 核 原理 。 在 每 一 章 的 
开头 都 首先 讲解 Unix 的 用 户 级 特性 。 通 过 “该 命令 有 什么 功能 ”* 这 个 问题 很 自然 地 将 读者 
引 向 了 另外 一 个 系统 级 的 问题 “该 功 能 是 如 何 实现 的 ?”。 

学 习 过 程 中 ,需要 读者 登录 Unix 系统 并 亲自 做 一 些 实验 ， 





可 以 学 到 什么 

书 中 介绍 了 Unix 系统 的 组 成 部 分 ,并 讲解 了 它们 的 功能 .工作 原理 及 如 何 使 用 它们 进 
行 编 程 。 在 这 个 过 程 中 ;读者 还 可 以 领悟 到 这 些 组 件 是 怎样 组 合成 这 个 统一 .智能 的 操作 系 

ARR FRM 1990 年 开始 在 哈佛 太 学 职业 教育 学 院 (Harvard Extension School) 执教 
的 一 门 澡 程 一 一 Unix 系统 编程 。 在 课程 评估 和 毕业 几 年 后 学 生 给 我 发 来 的 邮件 中 ,学 生 们 
向 我 描述 了 他 们 在 这 门 课 中 学 到 的 东西 ,一 个 学 生 说 这 门 课 给 了 他 “ 通 往 国 干 宝座 的 钥匙 "。 
无 论 用 户 级 .系统 级 还 是 理论 级 ,他 对 Unix 都 有 了 很 好 的 理解 ,他 觉得 他 已 经 可 以 应 对 各 个 
方面 的 情况 ,并 可 以 解决 所 碰 到 的 大 多 数 问题 。 还 有 一 个 学 习 过 这 门 课程 的 内 科 医 生 , 他 说 
他 很 喜欢 这 种 实例 教学 法 ,并 将 其 比 作 见习 医生 在 医院 里 通过 实际 病例 来 学 习 。 

还 有 一 个 毕业 后 在 开放 软件 公司 担任 项 目 主管 的 学 生 说 .这 门 课 穗 他 掌握 了 他 在 工作 
中 上 质 需 的 知识 和 技能 ， 
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适用 的 Unix 版 本 

本 书 适 用 于 包括 GNU 和 Linux 在 内 的 几乎 所 有 的 Unix 版 本 。 考 中 重点 讲述 构成 所 有 
Unix 版 本 基础 的 结构 和 技能 ,而 不 是 随 各 个 版 本 变化 的 具体 细节 。 只 草堂 握 了 这 些 基本 知 
识 , 那 些 细节 的 学 习 将 会 很 容易 上 手 。 
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第 1 章 Unix 系统 编程 概述 


概念 

* Unix 系统 包含 用 户 程序 和 系统 内 核 

。 内 核 由 多 个 子 系统 构成 

。 内 核 管理 所 有 的 程序 和 资源 

。 进程 之 间 的 通信 对 Unix 程序 是 很 重要 的 
。 什么 是 系统 编程 

相关 命令 

* bc 


* more 


LT or 2 


什么 是 系统 编程 ”什么 是 Unix 系统 编程 ? 本 书 具体 会 涉及 哪些 知识 ? 本 章 力图 回答 
上 述 问题 。 

首先 从 分 析 操 作 系 统 的 职责 入 手 , 来 解释 如 何 编 写 与 操作 系统 紧密 相关 的 程序 。 然 后 
通过 分 析 标 准 的 Unix 命令 ,以 及 它们 用 到 的 系统 调用 ,进一步 指导 读者 自己 编程 实现 相应 
的 功能 。 这 一 章 的 最 后 会 通过 一 幅 图 来 描述 Unix 系统 。 本 书 的 主要 学 习 形式 就 是 通过 图 
示 和 剖析 文中 程序 所 涉及 的 命令 、 技 术 , 进 而 实现 系统 编程 。 


1.2 什么 是 系统 编程 


1.2.1 简单 的 程序 模型 


你 可 能 写 过 各 种 各 样 的 程序 ,有 科学 计算 方面 的 ,金融 方面 的 ,图像 方面 的 .文字 处 理 方 
面 的 等 。 大 部 分 的 程序 都 是 基于 以 下 模型 ,如 图 1. 1 所 示 。 





图 1.1 计算 机 中 的 程序 
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在 这 个 模型 中 ,程序 就 是 可 以 在 计算 机 上 运行 的 一 段 代 码 ,程序 把 输入 数据 做 相应 
后 输出 。 例 如 用 户 在 键盘 上 输入 数据 ， SOSNNTNEIS. IRTEE, i 
可 能 会 用 到 打印 机 。 

遵循 上 述 模型 ,看 以 下 代码 : 


/* copy from stdin to stdout #/ 
main() 
( 
int c; 
while( ( c = getchar() ) != EOF ) 
putchar(c); 
} 


这 段 代码 对 应 图 1. 2 所 示 的 模型 。 






putchar ( ) 





图 1.2 程序 的 输入 1 输出 


在 图 1. 2 中 键盘 和 显示 器 与 程序 直接 相连 。 在 简单 的 个 人 计算 机 中 ,实际 情况 是 很 类 似 
的 ,键盘 和 显示 卡 直接 连 到 计算 机 的 主板 上 ,CPU 和 内 存 也 是 通过 插 槽 直接 连 在 主板 上 , 它 
们 通过 主板 上 的 印刷 线路 , 连 为 一 体 。 如 果 能 够 打开 机 箱 , 所 看 到 的 大 致 如 此 。 


1.2.2 系统 模型 
如 果 所 使 用 的 系统 是 一 个 多 用 户 系统 ,如 典型 的 Unix 系统 , 那 会 是 一 副 怎样 的 情形 呢 ? 





图 1.3 多 个 用 户 ,程序 和 设备 
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刚才 的 简单 模型 已 经 不 适用 ,图 1. 3 会 更 接近 一 些 。 

在 这 个 系统 中 有 多 个 用 户 同时 运行 多 个 程序 ,可 能 需要 访问 多 个 设备 。 

虽然 模型 复杂 了 ,但 对 程序 而 言 , 它 还 是 从 键盘 得 到 数据 ,将 结果 显示 在 显示 器 上 ,也 可 
以 对 磁盘 读 写 ,这 些 操作 都 没有 任何 问题 , 它 使 用 的 还 是 简单 模型 。 

接 下 来 考虑 一 种 更 为 复杂 的 情况 ,有 许多 键盘 /显示 器 ,它们 可 以 随意 地 连接 到 不 同 的 
程序 ,随意 地 操作 它们 ,这 种 情况 如 图 1.4 所 示 。 





图 1.4 终端 可 以 随意 地 连接 到 程序 
实际 上 ,在 计算 机 内 部 ,这 种 随意 的 连接 是 不 允许 的 ,必须 采用 一 种 机 制 进行 管理 。 


1.2.3 操作 系统 的 职责 


计算 机 用 操作 系统 来 管理 所 有 的 资源 ,并 将 不 同 的 设备 和 不 同 的 程序 连接 起 来 。 从 连 
接 的 角度 来 讲 , 操 作 系统 的 作用 就 像 主板 上 的 印刷 线路 一 样 。 
有 了 操作 系统 以 后 ,图 1. 4 的 混乱 状态 就 可 以 得 到 改变 ,新 的 模型 如 图 1. 5 所 示 。 





图 1.5 操作 系统 是 一 个 特殊 的 程序 


操作 系统 也 是 程序 ,与 普通 程序 一 样 ,也 运行 在 内 存 中 ,同时 它 又 是 一 个 特殊 的 程序 , 它 
能 把 普通 程序 与 其 他 程序 或 设备 连接 起 来 。 
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1.2.4 为 程序 提供 服务 


现在 的 问题 (系统 中 的 多 个 用 户 和 程序 是 如 何 连接 起 来 的 ) 和 大 致 的 解决 办 法 (通过 一 
个 管理 程序 ) 已 经 很 清楚 了 , 接 下 来 看 具体 的 解决 方案 。 

首先 要 解释 一 些 术语 ,内 存 空间 用 来 存放 程序 和 数据 ,就 像 古 雅典 大 腾 出 空间 来 放 衣 服 
一 样 ,所 有 的 程序 都 必须 在 内 存 空间 中 才能 运行 ,用 来 容纳 操作 系统 的 内 存 空间 叫做 系统 空 
[8] ,容纳 应 用 程序 的 内 存 空 间 叫 做 用 户 空间 。 

操作 系统 也 被 称 为 内 核 , 有 了 内 核 的 概念 后 ,再 来 看 计算 机 系统 的 连接 情况 ,如 图 1.6 
所 示 。 





图 1.6 内 核 管理 计算 机 系统 的 连接 


注意 ,在 图 1.6 中 可 以 发 现 , 程 序 要 访问 设备 (如 键盘 、 磁 盘 和 打印 机 ) 必 须 通 过 内 核 , 所 
以 只 有 内 核 才能 直接 管理 设备 。 

程序 如 果 要 从 键盘 得 到 数据 ,必须 向 内 核发 出 请 求 , 若 在 显示 器 上 显示 结果 ,也 要 通过 
内 核 ,程序 中 所 有 对 设备 的 操作 都 是 通过 内 核 进行 的 。 

1.6 中 的 线 是 内 核 提供 的 虚拟 连接 线 , 内 核 向 程序 提供 服务 以 便 程序 能 够 访问 到 设备 。 

解释 了 这 些 内 容 后 ,再 来 看 什么 是 系统 编程 :编写 普通 程序 时 可 以 认为 ,程序 是 直接 连 
到 键盘 显示器、 磁盘 等 设备 的 ,但 在 进行 系统 编程 时 ,必须 对 系统 的 结构 和 工作 方式 有 更 深 
的 了 解 , 要 知道 内 核 提供 哪些 服务 (系统 调用 ), 如 何 使 用 它们 ,系统 有 哪些 资源 和 设备 ,不 同 
的 资源 和 设备 该 如 何 操作 。 


1.3 理解 系统 编程 


内 核 提供 服务 以 便 系 统 程序 可 以 直接 访问 系统 资源 ,那么 有 哪些 系统 资源 和 服务 呢 ? 
1.3.1 系统 资源 


l. 处 理 器 (Processor) 
程序 是 由 指令 构成 的 ,处 理 器 是 执行 指令 的 硬件 设备 ,一 个 系统 中 可 能 有 多 个 处 理 器 。 
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内 核能 够 安排 一 个 程序 何 时 开始 执行 , 何 时 暂时 停止 E AIT RTE EIT 

2. ft A dr CI/O) 

程序 中 所 有 输入 /输出 的 数据 ,终端 的 输入 /输出 数据 还 有 硬盘 输入 /输出 数据 ,部 必须 
流 经 内 核 ,这 种 集中 的 椒 理 方式 有 以 下 优点 ; 正确 性 ,数据 流 不 会 流 错 地 方 ; 有 效 性 ,程序 员 
无 需 考 虑 不 同 设备 之 癌 的 差异 ; 安全 性 ,数据 信息 不 会 被 未 被 授权 的 程序 非法 访问 。 

3 进程 管理 (Process Management) 

进程 指 程序 的 一 次 运行 ,每 个 进程 都 有 自己 的 资源 ,如 内 存 . 打 开 的 文件 和 其 他 运行 时 
所 需 的 系统 资源 。 内 核 中 与 进程 相关 的 服务 有 新 建 一 个 进程 ,中 止 进程 .进程 调度 等 。 

4， 兴 在 (Nemory) 

内 存 是 计算 机 系统 中 很 重要 的 资源 ,程序 必须 被 装载 到 内 存 中 才 可 以 运行 。 内 核 的 职 
夷 之 一 是 内 存 管 理 , 在 需要 的 时 候 纵 程序 分 配 内 存 , 当 程序 不 需要 的 时 候 回 收 内 存 ; 内 核 还 
能 够 保证 内 存 不 被 其 他 的 进程 非法 访问 。 

5. g GDevice) 

计算 机 系统 中 可 以 有 各 种 各 样 的 外 设 , 如 磁带 机 .光驱 .鼠标 .扫描 仪 和 数码 摄像 机 等 ， 
它们 的 操作 方式 各 不 相同 ,内 核能 屏蔽 掉 这 种 差异 ,使 得 对 设备 的 拘 作 方式 简单 而 统一 。 便 
如 ,一 个 程序 想 最 从 数码 照相 机 中 取出 照片 存 情 在 计算 机 中 , 它 只 需 向 内 核 提出 操作 该 资源 
的 请 求 即 可 。 

6, 计时 器 (Timers) 

程序 的 工作 与 时 间 有 关 , 有 的 需要 定时 被 甬 发 ,有 的 需要 等 一 段 时 间 再 开始 某 个 动作 ， 
_ 有 的 需要 知道 菜 一 个 操作 消耗 的 时 间 ,这 些 都 涉及 计时 器 ,内 核 可 以 通过 系统 调用 向 应 用 程 
序 提 供 计 时 器 服务 。 

7. BE 48 fa] 38 42 Cinterprocess Communieation) 

在 现实 生活 中 人 们 通过 电话 email, 信件 .广播 .电视 等 下 相通 信 , 在 计算 机 的 世界 中 ， 
不 同 的 进程 也 需要 互相 通信 ,内 核 提供 的 服务 使 进程 间 通 信 成 为 可 能 。 就 像 电 信和 邮政 提 
供 的 服务 ,通信 也 是 资源 。 

8 网 络 (Networkingy》 

网 络 之 间 的 通信 可 以 看 作 是 进程 间 通 信和 的 特殊 形式 ,通过 网 络 ,不 同 主机 上 的 进程 , 即 
使 使 用 的 是 不 同 操作 系统 ,也 可 似 互 相通 信 。 网 络 通信 也 是 内 核 提 供 的 服务 。 


1.3.2 目标 : 理解 系统 编程 


刚才 已 经 简单 介绍 了 内 核 所 提供 的 各 种 类 型 的 服务 ,各 种 内 核 服 务 具 体 有 什么 特点 ,会 
用 到 名 些 设备 ,需要 有 哪 些 参数 ,会 提供 名 些 数据 , 接 下 来 的 目标 是 掌握 内 核 服 务 的 机制 ,以 便 
在 自己 的 程序 中 使 用 这 些 服 务 。 


1.3.3 方法 : 通过 三 个 问题 来 理解 
本 书 通 过 以 下 3 个 步骤 来 学 习 。 
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1i. 2 NAE 

首先 分 析 现 有 的 程序 ,了 解 它 的 功能 及 实现 原理 。 

2. 学 习 系 统 调用 

看 程序 都 用 到 哪些 系统 调用 ,以 及 每 个 系统 调用 的 功能 和 使 用 方法 ， 
3， 编 程 实现 

利用 学 到 的 原理 和 系统 调用 ,自己 编程 实现 原来 程序 所 实现 的 功能 。 
以 上 3 步 可 以 通过 下 面 3 个 问题 来 实现 : 

* 它 能 做 什么 ? 

* 它 是 如 何 实 现 的 ? 

* 能 不 能 自己 编写 一 个 ? 


1.4 从 用 户 的 角度 来 理解 Unix 
1.4.1 Unix 能 做 些 什 么 


要 学 习 Unix 系统 编程 ,首先 看 看 Unix 能 做 些 付 么 。 下 面 从 一 个 从 终端 登录 到 系统 中 
的 普通 用 户 的 角度 来 看 Unix 是 什么 , 它 能 做 些 什 么 。 


1.4.2 登录 一 送行 程序 一 注销 


使 用 Unix 的 过 程 一 般 如 下 : 登录 到 系统 中 ,运行 程序 ,工作 结束 后 再 注销 。 登 录 的 时 候 
要 输 人 用 户 名 和 密码 ， 


Linux 1,2.13 (maya) (ttypl) 
maya login; betsy 
Password; | 


登录 到 系统 中 以 后 ,就 可 以 运行 备 种 各 样 的 程序 了 ,比如 收发 邮件 程序 、 科 学 计算 程序 
以 及 游戏 程序 

运行 程序 也 很 简单 , 当 显示 器 上 出 现 提示 符 后 (一 般 是 *s”) ,输入 程序 的 名 字 , 按 回 车 ， 
程序 将 开始 运行 。 运 行 结 束 后 ,提示 符 再 次 出 现 。 

贸 形 用 户 界 面 的 操作 方式 实际 上 也 是 这 样 的 。 图 标 和 菜单 可 以 看 作 是 提示 符 , 双 击 图 
标 就 像 运 行 命令 一 样 ,系统 会 把 双击 操作 解释 为 相应 程序 的 执行 。 

运行 完 程 序 后 ,可 以 从 系统 中 注销 : 





$ exit 


在 有 些 系统 中 ,可 以 通过 输入 logout REAL A Ctrl+D 来 注销 。 

它 是 如 何 工作 的 昵 ? 

这 看 起 来 很 简单 ,但 系统 在 内 部 是 如 何 处 理 的 呢 ? 

首先 来 看 登录 过 程 。 人 们 常 说 使 用 计算 机 就 像 使 用 自己 的 汽车 一 样 ,这 晨 个 人 计算 机 
中 的 概念 ,问题 在 于 Unix 允许 许 包 用户, 可 能 是 几 十 甚至 几 百 人 ;同时 登录 到 系统 中 ,系统 
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是 如 何 对 这 么 多 的 用 户 进行 管理 的 呢 ? 

在 登录 过 程 中 , 当 用 户 名 和 密码 通过 验证 后 ,系统 会 启动 一 个 叫 shell 的 进程 ,然后 把 用 
户 交 给 这 个 进程 ,由 这 个 进程 处 理 用 户 的 请 求 。 每 个 用 户 都 有 属于 自己 的 shell 进程 。 

1.7 是 用 户 登 录 到 Unix 系统 中 的 示意 图 。 





图 1.7 用 户 登录 到 系统 


图 1. 7 中 左边 的 大 盒子 表示 计算 机 系统 , 坐 在 键盘 和 显示 器 前 的 是 用 户 ,计算 机 里 有 内 
存 , 内 核 运行 在 内 存 中 ,shell 为 用 户 提供 服务 ,shell 和 用 户 之 间 的 连接 由 内 核 控制 。 

Shell 在 屏幕 上 显示 出 提示 符 , 表 示 现 在 可 以 接收 用 户 的 输入 。 对 于 普通 用 户 而 言 提 示 
符 一 般 是 “s”, 也 可 能 还 会 显示 其 他 的 提示 信息 。 用 户 可 以 在 提示 符 后 输入 要 运行 的 程序 的 
名 字 , 内 核 负 责 把 用 户 的 输入 传 给 shell。 例 如 ,运行 显示 日 期 和 时 间 的 程序 如 下 : 


$ 
$ date 
Sat Jul 1 21:34:10 EDT 2000 


$ - 


date 命令 显示 出 日 期 , 接 下 来 显示 命令 提示 符 。 
要 运行 其 他 命令 ,只 要 输入 程序 名 即 可 ,Unix 中 有 一 个 程序 fortune, 下 面 是 它 运行 的 
例子 : 


$ fortune 
Algol- 60 surely must be regarded as the most important 
programming language yet developed. 
—- T. Cheatham 
$. 


当 用 户 注销 时 ,内 核 会 结束 所 有 分 配给 这 个 用 户 的 进程 。 
内 核 是 如 何 创建 shell 进程 的 呢 ? shell 进程 是 如 何 得 到 输入 的 程序 名 ,内 核 又 是 如 何 运 
行程 序 的 呢 ? 登录 系统 和 运行 程序 并 非 想像 的 那么 简单 。 这 些 细 节 会 在 第 8 章 讨 论 。 
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1.4.3 目录 操作 


用 户 登 录 后 ,可 以 对 白 己 的 文件 进行 操作 。 文 件 中 可 以 有 e-mail、 图 片 . 源 程序 .可 执行 
程序 等 各 种 各 样 的 数据 。 文 件 被 组 织 在 目录 中 。 

l. AR 

在 Unix 系统 中 ,文件 和 日 涝 被 组 织 成 树 状 结构 , Unix 提供 相应 的 命令 来 对 目录 进行 
SE. 

E 1.8 是 一 个 日 录 树 的 例子 。 





图 1.8 日 录 树 的 一 部 分 


如 图 1.8 所 示 ,文件 系统 的 最 预 端 是 “/”, 它 岂 做 根 哩 录 , 根 肯 录 一 般 都 包含 几 个 子 届 录 。 
KER Unis ABER El 3€ FP A / etc. /home,/bin 等 几 个 子 目录 ,它们 都 有 特定 的 用 
途 , 比 如 大 多 数 的 Unix 用 户 都 有 自己 的 主 目录 ,而 一 般 来 说 用 户主 目录 就 在 /home BH, 

Unix 系统 中 有 很 多 命令 都 与 目录 有 关 , 如 新 建 日 录 ,. 删 除 目 录 .改变 当前 目录 ,、 列 出 目录 
内 容 等 , 读 完 本 节 的 内 容 后 可 以 自己 试 一 试 这 些 命令 。 

2. 目录 操作 命令 

(1) ls 一 一 到 出 目录 内 容 

ls 命令 的 作用 是 列 出 目录 的 内 容 , 即 当前 目录 里 的 文件 和 子 目 杂 ,如果 只 输 人 js, 那么 列 
出 的 是 当前 日 录 的 内 容 , 如 果 输 入 ls dirname ,那么 列 出 的 是 dirname 所 指定 的 目录 的 内 容 ， 
MBA: 





ls /etc 


会 列 


= 


Hei 目录 里 面 所 包含 的 文件 和 子 目录 ,同样 地 ,如 果 输 人 : 





ls f 


刚 会 列 出 根 目录 的 内 容 。 
(2) ed 改变 当前 目录 





cd 命令 的 作用 是 改变 当前 的 目录 。 当 刚刚 登录 到 系统 中 时 ,当前 目录 是 自己 的 主 具 录 ， 
可 以 通过 cd 命令 转 到 其 他 目录 ,如 : 
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cd /bin 


Af sl /bin 上 且 录 下 ,这 个 目录 中 有 很 多 系统 命令 ,可 以 用 1s 查看 有 哪些 命令 。 通 过 下 述 命令 
转 到 上 一 层 目录 : 


cd.. 
it 4865 B REA ,通过 下 述 命令 都 可 以 立即 回 到 用 户 的 主 目录 : 


cd 


(3) pwd 一 一 显示 当前 目录 
pwd 命令 告诉 当前 目录 是 什么 , 它 列 出 的 是 全 路 径 , 即 从 根 目录 开始 的 路 径 , 如 : 


$ pwd 


/home/cse215/samples 


从 上 述 操作 可 以 知道 ,当前 月 录 是 通过 从 根 目 录 开 始 ,依次 进入 home, cse215 samples 
来 得 到 。 

(4) mkdir .rmdir 新 建 . 删 除 目 录 

用 mkdir 来 新 建 目录 ,如 : 





5 ed 
$ mkdir jokes 


先进 入 主 目 菜 ,然后 在 主 目录 中 建立 jokes 这 样 一 个 目录 。 一 般 来 说 ,只 能 在 自己 的 目 
录 中 新 建 目 录 而 不 允许 存 其 他 用 户 的 日 录 中 新 建 目 录 。 
要 删除 一 个 已 经 存在 的 目录 ,可 以 用 rmdir 命令 ,如 : 


$ rmdir jokes 


如 果 jokes 内 录 是 空 目录 , 那 这 个 命令 可 以 把 jokes 删除 。 注 意 用 rmdir 来 删除 目录 , 必 
须 先 把 号 录 中 的 文件 和 子 目录 删除 或 移 走 。 

3. 目录 操作 命令 的 工作 原理 

从 刚才 的 分 析 可 以 知道 硬盘 上 的 目录 和 文件 构成 了 一 棵 目录 树 , 树 的 中 间 结 点 是 目录 ， 
每 个 目录 又 可 以 包含 很 多 的 子 目 录 和 文件 ,可 以 新 建 或 删除 目录 ,可 以 从 一 个 目录 转 到 其 他 
WAR. 

然而 这 些 是 如 何 工作 的 呢 ? 首先 来 考察 硬盘 ,硬盘 是 由 很 多 片 金 属 或 玻璃 的 盘 片 组 合 
起 来 构成 的 ,这 些 盘 片上 可 以 保存 磁性 信息 ,问题 是 目录 在 哪里 ? 用 户 在 自己 的 主 目录 中 意 
昧 着 什么 ” 转 到 其 他 目录 叉 意 味 着 什么 ? Unix 允许 很 多 用户 同时 登录 到 系统 中 ,他 们 可 以 
有 相同 的 当前 目录 ,也 可 以 在 不 同 的 目录 中 ,会 不 会 因为 很 多 用 户 在 同一 个 目录 中 导致 这 个 
目录 过 分 拥挤 ? 还 有 的 问题 是 ,如 果 要 自己 来 编写 一 个 改变 当前 目录 的 程序 ,该 如 何 来 实 
BL? 内 核 在 这 棵 目录 树 中 扮演 什么 角色 ? 
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1.4.4 文件 操作 


文件 存放 在 目录 中 ,用 户 文件 位 于 用 户 自 己 的 主 目 录 中 ,系统 文件 位 于 系统 目录 中 。 对 
文件 的 操作 有 哪些 呢 ? 

l. 文件 操作 的 命令 

CO 交 件 命名 规则 

每 个 文件 都 有 文件 各 ,在 大 多 数 的 Unix 系统 中 ,文件 名 最 长 可 以 是 250 个 字符 ,很 多 字 
符 都 可 以 出 现在 文件 各 中 ,如 大 小 写字 符 、 标 点 符号 .空格 ,tab, 甚 至 回 车 符 , 但 是 不 能 包含 根 
HRS”. 

(2) cat, more, less, p — EALAR 

上 述 命令 都 可 以 用 来 查看 文件 的 内 容 , 但 也 有 些 细 微 的 差别 ,cat 一 下 子 列 出 文件 的 所 有 
内 容 : 











5 cat shopping- list 
soap 

cornflakes 

milk 

apples 

jam 


$ 
HAARR ERE E BEA SORS SERE more 会 更 加 合适 : 


§ more longfile 


显示 一 屏 后 会 暂停 输出 ,这 时 用 户 按 空格 键 more SE T an FE E EL YS 
显示 下 一 行 ,输入 “g” 则 退出 。 另 外 两 个 命令 less 和 pg 的 功能 与 more 是 类 似 的 。 

(3) cp 文件 复制 

可 以 用 ep 命令 米 复制 文件 ,如 ; 








$ cp shopping- list last. week. list 


将 文件 shopping- list 复制 一 份 ,新 的 文件 名 为 ljast week. list 。 
(4) rm 一 -文件 其 除 
删除 文件 的 例子 如 下 : 


$ rm old.data junk shopping. june1992 


一 次 删 掉 了 3 个 文件 。 

Unix 并 不 提供 俱 复 被 删除 文件 的 功能 ,其 中 一 个 原因 是 Unix 是 一 个 多 用 户 系统 , 当 一 
个 文件 被 删 掉 以 后 , 它 所 占用 的 存储 空间 可 能 被 立即 分 配给 其 他 用 户 的 文件 ,有 可 能 某 块 磁 
盘 空 间 刚才 还 是 你 的 学 期 论文 ,下 -个 时 刻 就 变 成 了 另外 一 个 用 户 的 局 程 序 , 所 以 成 功 恢复 
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的 可 能 性 很 低 。 
(50 mv 一重 命名 或 移动 文件 
mv 命令 可 以 更 改 文件 名 或 动 交 件 ,如 ; 


$ mv progl.c first program.c 


将 文件 progi. c 改名 ,新 的 名 字 是 first. program. c. 
也 可 以 移动 文件 , 即 政 变 文 件 的 位 置 , 如 : 


5 mkdir mycode 
$5 mvfirst program.c mycode 


新 建 一 个 日 录 mycode, 然 后 将 first. program. c 移动 到 这 个 目录 中 。 
(62 lpr. lb 一 一 打印 文件 
用 ljpr 来 打印 文件 ,如 : 


$ lpr filename 


上 述 命令 把 filename 3X BRA BUTT VELIT ED «di 26 X REAR IE G AV FT EDL RT 
通过 lpr dii A TR XE HUS — G8 3T EH A HE RR cp RT p 命令 来 完成 pr 的 工作 。 

2. 文件 操作 命令 的 工作 原理 

从 用 户 的 角度 来 看 ,文件 是 数据 的 集合 ,文件 中 的 数据 是 如 何 存储 在 磁盘 上 的 ? 文件 是 
如 何 被 复制 的 ? 如 何 称 动 和 改名 的 ? 进一步 来 讲 , 文 件 的 名 字 存 放 在 哪里 ?作为 一 个 系统 
程序 员 ,必须 能 够 同 答 这 些 问 题 ,而 这 些 问题 的 答案 就 在 Unix 系统 中 ， 

3. 文件 许可 权限 

系统 中 每 个 用 户 都 有 自己 的 文件 ,出 于 很 多 原因 ,你 不 会 希望 别 的 用 户 能 够 修改 自己 的 
文件 ,甚至 读 也 不 行 。 系 统 中 有 一 些 管理 命令 ,如 果 使 用 得 不 好 会 对 系统 造成 损害 ,管理 员 
不 希望 普 道 用 户 也 有 运行 这 些 命令 的 权力 。 这 些 对 文件 和 命令 操作 的 限制 是 如 何 行使 的 呢 ? 

Unix 通过 一 些 文件 属性 来 对 文件 和 命令 的 操作 进行 控制 。 每 个 文件 都 有 文件 所 有 者 
(owner 和 文件 许可 权限 ， 文 件 所 有 者 指明 了 系统 中 某 -- 个 用 户 ,文件 的 创建 者 就 是 文件 所 
AA. 

文件 许可 权限 分 为 3 组 ,通过 ls -1 命令 可 以 看 到 ， 








$ is - 1 outline. 01 
—rwxr-x--- 1 molay users 1064 Jun 29 00.39 outline. 01 


-1 称 为 命令 行 选项 ,选项 -1 使 得 ls 输出 文件 的 详细 信息 。 同 一 个 命令 ,可 以 通过 不 同 
的 选项 ,使 它 所 做 的 工作 稍 有 不 同 。 这 里 的 文件 详细 信息 包含 文件 的 许可 权限 .文件 所 有 
者 、 文 件 长 度 、 最 后 修改 时 间 等 ,其 中 的 “rwxr - x--- ”就 是 文件 许可 权限 。 

每 个 文件 都 有 文件 所 有 者 和 3 组 许可 权限 ， 
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一 TWX rwx rwx r,read, w.write, x;execute 


user group other 


与 3 组 许可 权限 相对 应 ,用 户 也 被 分 为 3 组 : user, MAF MAA: group. SRM AS A 
组 的 用 户 ; othe AAP. 每 组 的 用 户 都 可 以 有 3 种 权限 : 读 权 限 . 写 权限 和 执行 权限 。 
这 样 针 对 不 同 用 户 -一 共 是 9 个 权限 ,这 些 权 限 可 以 分 别 设 定 ,如 可 以 指定 其 他 用 广 只 能 修 收 
文 忻 而 不 能 读 文 件 , 文 件 所 有 者 甚至 可 以 取消 自己 读 自 己 文件 的 权限 。 

4. RHP TRY LER 

文件 许可 权限 是 如 何 工 作 的 ? 怎么 来 设置 ” 系统 是 如 何 应 用 刚才 讲 到 的 权限 的 ? 许可 
权限 存放 在 哪里 ”在 后 续 的 章节 会 对 这 些 问 题 做 解答 。 


1.5 从 系统 的 角度 来 看 Unix 


15.1 用 户 和 程序 之 间 的 连接 方式 


前 面 的 小 节 从 用 户 的 角度 来 看 Unix 系统 ,用 户 登 录 到 系统 中 ,运行 程序 ,再 从 系统 中 退 
出 。 与 此 同时 ,可 能 有 很 多 其 他 用 户 也 在 登录 ,运行 程序 或 退出 系统 ,他 们 可 以 同时 对 一 个 
文件 进行 操作 ,好像 工作 在 各 白 独 立 的 室 间 中 ,他 们 之 间 还 可 以 通过 发 送 e-mail 或 即时 消息 
进行 沟通 。 

其 实 每 个 独立 的 室 间 都 是 系统 的 一 部 分 ,从 宏观 的 角度 来 看 ,系统 还 可 能 由 很 多 的 用 
户 , 很 多 程序 , 黄 至 很 多 计算 机 系统 互相 连接 而 成 。 接 下 来 ,将 通过 3 个 例子 来 看 系统 是 如 何 
工作 的 ,如 何 编程 使 系统 中 的 不 同 部 分 做 到 协调 统一 。 


1.5.2 网 络 桥牌 


许多 人 都 玩 网 络 轿 牌 这 个 游戏 ,世界 各 地 的 玩家 通过 计算 机 网 络 连接 到 一 起 ,游戏 开始 
以 后 ,参加 者 就 可 以 看 到 一 个 共同 的 牌 府 , 能 够 看 到 别人 出 的 牌 , 图 1.9 是 一 个 简单 的 说 明 。 








图 1.9 4 个 人 通过 网 络 打 桥牌 


向 1.9 中 有 4 个 人 ,他 们 每 人 都 有 一 台 计 算 机 ,通过 网 络 连 接 在 一 赵 。 但 图 1.9 中 还 消 
了 牌 桌 , 下 面 把 它 加 上 ,如 图 1.10 Sp. 
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fl 1.10 服务 器 上 的 牌 桌 


图 1. 10 中 增加 了 第 5 个 实体 一 一 牌 桌 , 牌 桌 位 于 服务 器 上 ,在 4 个 玩家 的 眼 里 , 牌 是 放 
在 牌 桌 上 的 ,他 们 也 是 通过 牌 桌 才能 够 开始 游戏 。 

在 现实 生活 中 玩 牌 的 时 候 , 人 们 轮流 出 牌 , 但 在 网 络 游戏 中 ,是 由 谁 来 控制 该 哪 一 个 人 
出 牌 ? 牌 又 存放 在 哪里 ? 某 个 人 手中 有 几 张 牌 又 意味 着 什么 ? 如 何 来 保证 不 让 两 个 人 有 同 
一 张 牌 ? 这 在 现实 生活 中 不 会 有 任何 问题 ,但 在 虚拟 的 网 络 中 确实 要 仔细 考虑 。 

图 1.11 显示 了 在 网 络 桥牌 中 的 信息 流 。 


a 


图 1.11 分 布 的 程序 向 其 他 用 户 发 送信 息 


网 络 桥牌 的 例子 展示 了 Unix 系统 编程 中 3 个 重要 的 方面 。 

(1) 通信 

某 个 用 户 或 进程 如 何 与 其 他 用 户 或 进程 交换 信息 ? 

(2) 协作 

在 同一 个 时 刻 , 网 络 桥牌 的 两 个 用 户 不 会 都 去 拿 同一 张 牌 ,程序 如 何 来 协调 多 个 进程 使 
他 们 能 够 没有 冲突 地 访问 共享 资源 ? 

(3) 网 络 访问 

在 这 个 例子 中 ,互相 独立 的 计算 机 通过 网 络 连接 到 一 起 ,那么 计算 机 中 的 程序 是 如 何 来 
使 用 网 络 的 呢 ? 


1.5.3 bc; Unix 的 计算 器 


Unix 系统 中 的 be 命令 是 执行 一 个 基于 字符 的 计算 器 程序 ,bc 有 两 个 重要 的 特点 , 稍 后 
会 讲 到 。 要 启动 这 个 计算 器 ,只 要 输入 : 
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$ be 
不 会 有 任何 的 版 本 信息 和 提示 信息 出 现 , 但 这 时 已 经 可 以 接收 输入 了 ,如 ， 


2+3%4+5%10 


be 会 显示 计算 结果 ,而且 它 知道 先知 乘法 再 做 加 法 。 要 退出 be. # Ctrl+D #. 
bc 的 一 个 重要 特点 是 , 它 可 以 处 理 很 大 的 整数 ,如 ， 


9$9999999999999999999 = S88888888888B8B8BBB588 
B8B8888888888B8888887111111111111111111i2 


为 了 得 到 更 大 的 整数 ,可 以 借助 于 寡 运 算 ， 


3333 ^ 44 
1011006158449564099500583846218228579482240528849807070336511*X 
1794768438904110649252911543814658907219481422090046883818703Y 
5540915541156321805747562427309521 


3333 的 44 次 方 , 得 到 的 整数 足 足 有 两 行 半 那么 长 ,be 还 是 可 编程 的 ,可 以 定义 变量 ,有 
多 辑 判断 和 循环 结构 ,语法 与 C 语言 类 似 , 如 : 


x-3 

if (x == 34 
Yux* 3; 

} 

¥ 


be 195 TERR AE MORNE EG be 并 不 做 任何 计算 。 为 了 说 明 这 一 点 ,做 
如 下 操作 ， 


$ be 
2*3 

5 

*7- press Ctrl- Z here 


Stopped 

$ps 

PID TIY S TIME CMD 
25102  ttyp2 T 0;00.02 bc 
27081  ttyp? T  0;00.01 de - 
27550 ttyp2 I 6:00.59 - bash 
27681  ttyp2 T 0:00. 00 be 


$ fg 
-L—- press Ctr] - D here 


ps 命令 可 以 列 出 系统 中 运行 的 所 有 进程 ,这 里 -一 共有 4 个 进程 ,除了 两 个 be 外 ,bash 是 
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shell 进程 ,那么 dc 是 什么 ? 
在 大 多 数 的 Unix 系统 中 都 提供 了 联机 帮助 ,可 以 从 那里 得 到 需要 的 信息 ,要 找 关于 de 
的 信息 ,只 要 输入 : 


$ man dc 

User Commands dc(1) 

NAME 
dc - desk calculator 

SYNOPSIS 
dc [ filename ] 

DESCRIPTION 
dc is an arbitrary precision arithmetic package . Ordinarily 
it operates on decimal integers, but one may specify an 
input base, output base, and a number of fractional digits 
to be maintained. The overall structure of dc is a stacking 
(reverse Polish) calculator. If an argument is given, input 
is taken from that file until its end, then from the standard 


input. 


这 些 信息 来 自 于 SunOS 5. 8 的 联机 帮助 ,大 多 数 Unix 系统 关于 dc 的 描述 都 是 类 似 的 ， 
它 说 明了 dc 是 一 个 计算 器 , 它 能 够 接收 逆 波兰 表达 式 , 算 出 表达 式 的 值 。 逆 波兰 表达 式 指 的 
是 操作 数 在 前 ,操作 符 在 后 ,也 称 做 后 缀 表达 式 ,如 要 计算 表达 式 2+ 3 的 值 , 它 所 对 应 的 逆 波 
兰 表达 式 是 23 + ,dc 的 输入 /输出 如 下 : 


oo + € M 


内 部 进行 的 操作 是 这 样 的 : 先 将 2 入 栈 , 再 将 3 人 栈 ,然后 将 栈 顶 的 两 个 数 出 栈 ,计算 它 
们 的 和 ,并 将 结果 入 栈 ,p 是 为 了 将 栈 顶 元 素 打 印 出 来 。 这 样 可 以 知道 dc 是 一 个 基于 栈 的 计 
算 器 ,那么 bc 是 什么 ? de 的 运行 条 件 又 是 如 何 被 满足 的 呢 ? 

i f be 的 联机 帮助 就 会 知道 ,bc 是 dc 的 预 处 理 器 , 它 将 用 户 输入 的 表达 式 转换 成 道 波 
兰 表达 式 , 然 后 通过 一 个 称 为 管道 (pipe) 的 通信 程序 交 给 dc, 如 图 1. 12 所 示 。 


22+p 2+2 


"rw ——M 


图 1.12 程序 交换 信息 
用 户 输入 中 组 表达 式 如 “2 十 2”,bc 将 它 转化 为 相应 的 后 缀 表达 式 形式 , 交 给 dc 执行 ,dc 
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计算 表达 式 的 值 ,将 结果 返回 给 be, be 再 将 结果 以 合适 的 形式 显示 在 显示 器 上 。 所 以 对 普通 
用 户 而 言 ,bc 就 是 计算 器 。 

与 网 络 桥牌 类 似 , 计 算 器 也 是 由 不 同 的 程序 互相 协作 构成 一 个 完整 系统 的 ,每 个 程序 有 
各 自 的 功能 ,互相 独立 、 相 互 协作 。Unix 系统 编程 在 很 多 场合 下 ,就 是 要 解决 好 建立 这 些 独 
立 程序 之 间 的 连接 和 协作 方式 的 问题 。 


1.5.4 从 be/dc 到 Web 


从 架构 的 角度 来 看 ,万 维 网 (World Wide Web) 与 bc/dc 是 十 分 类 似 的 。 通 过 刚才 的 学 
习 可 以 知道 bc 负责 用 户 界面 ,dc 负责 后 台 运 算 ,在 万 维 网 中 ,浏览 器 负责 用 户 界面 ,在 后 面 
负责 提供 网 页 的 是 Web 服务 器 ,如 图 1. 13 Bros. 






http: // www.xyz.com/ info 
M 





<html><head><title> … 


图 1.13 游览 器 和 Web 服务 器 通信 


用 户 直接 操作 浏览 器 ,从 浏览 器 上 看 到 网 页 的 效果 ,而 网 页 并 不 存放 在 浏览 器 上 ,而 是 
存放 在 Web 服务 器 上 ,网 页 由 HTML 语言 写成 ,就 像 dc 的 语法 一 样 ,HTML 不 是 很 容易 理 
解 , 且 不 直观 。 用 户 端 的 工具 一 一 浏览 器 就 像 bc 一 样 ,从 服务 器 上 接收 到 信息 后 ,会 把 它 以 
容易 理解 的 形式 直观 地 显示 给 用 户 。 

所 以 说 万 维 网 与 be/de 是 类 似 的 ,而 Web 首先 出 现在 Unix 平台 上 也 是 一 件 自然 而 然 的 
事情 。 


1.6 动手 实践 


前 面 的 部 分 通过 两 个 问题 进行 学 习 , 它 们 是 “ 它 能 做 什么 ?” 和 * 它 是 如 何 实现 的 ?” 接 下 
来 应 该 是 第 三 个 问题 了 :“ 能 不 能 自己 编写 一 个 ?”。 在 本 节 试 着 自己 编写 一 个 程序 来 实现 
more 的 功能 。 

首先 ,more 能 做 什么 ? 

more 可 以 分 页 显示 文件 的 内 容 , 大 部 分 的 Unix 系统 都 有 文本 文件 /etc/termcap, 它 经 
常 被 文本 编辑 器 和 游戏 程序 用 到 ,用 more 来 查看 它 的 内 容 : 


$ more /etc/termcap 
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more 会 显 基 文件 第 一 屏 的 内 容 , 在 斌 幕 的 底部 ,more 用 反 白 字体 显示 文件 的 百分比 ;这 
时 如 果 按 空格 键 ,文件 的 下 一 屏 内 容 会 显示 出 来 ,如 朵 按 回 车 键 ,显示 的 则 是 下 一 行 , 如 果 输 
Aq" ;结束 显示 ,如 果 输 入 “h”, 显 示 出 来 的 是 more 的 联机 帮助 。 

注意 , 当 按 空格 链 或 输 人 “qd? 后 ,程序 会 立即 响应 ,而 无 需 再 按 回 车 键 。 

more 有 3 种 用 法 ; 


5 more filename 
$ command | more 


$ more — filename 


第 一 种 情况 more 显示 文件 filename 的 上 内容 ;第 二 种 情况 ,more 将 command 命令 的 输 
出 分 页 显示 ; 第 二 种 情况 ,meore 从 标准 输入 获取 要 分 页 显示 的 上 内容, 而 这 时 more 的 标准 输 
入 被 重 定 向 到 文件 filename, 

第 二 个 问题 ,more 是 如 何 实现 的 ? 

通过 运行 more 并 观察 结果 可 以 知道 ,more 的 工作 流程 如 下 : 


+---+-+>> show 24 lines from input 

| +-—> print [more?] message 

| | Input Enter, SPACE, or q 

| *-- if Enter, advance one line 
+t---- if SPACE 


if q -->> exit 


接 下 来 要 编写 的 程序 应 该 像 实际 的 more -一 样 , 有 足够 的 灵活 性 ,也 就 是 说 ,如 果 在 命 念 


行 中 给 出 了 文件 名 ,那么 就 分 页 显示 这 个 文件 ,否则 的 话 ,从 标准 输入 得 到 要 分 页 显示 的 内 
容 。 下 面 是 more 的 第 一 个 版 本 : 


/* more0l.c — version 0.1 of more 
* read and print 24 lines then pause for a few special commands 
x! 
# include << stdio. h> 
# define PAGELEN 24 
H define LINELEN 512 
void do _more( FILE # ); 
int see more(); 
int main( int ac, char x av[]) 
1 
FILE * fp; 
if (ac == 1) 
do more(stdin), 
else 
while ( —— ac) 
if (Cfp = fopen( * ++av, "r" )) (= NULL) 
{ 
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do more( fp); 
fclose( fp); 
} 
else 
exit(1); 
return Q; 
) 
void do more( FILE « fp} 
fe 


» read PAGELEN lines, then call see more() for further instructions 

*Ó 

{ 
char line[ LINELEN |; 
int num of lines - 0; 


int see more(), reply; 


while ( fgets( line, LINELEN, fp) )| /* more input */ 
if ( num of lines == PAGELEN ) ! /* full screen? x/ 
reply = see_more(); /* y, ask user s’ 
if (reply == 05 /* n: done #/ 
break; 
num of lines -= reply; /* reset count */ 
t 
if ( fputs( line, stdout ) == EOF } /* show line &/ 
exit(1); js or die »/ 
num of lines ++; /* count it «/ 


1 
int see more() 
/* 
* print message, wait for response, return # of lines to advance 


* q means no, space means yes, CR means one line 


x 
1 
int c; 
printf('"X033[7m more? X033[| n); /* reverse on a vt100 #/ 
whilet {c = getchar()) |= EGF ) /* get response */ 
1 
if {g == 'q') i > Ne; 
return 0; 
if te == t') fx t = next page x/ 
return PAGELEN; /* how many to show «/ 
if (e == mni) /* Enter key => 1 line sy 


return 1; 
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return 0; 


} 


这 段 代码 有 3 个 函数 ,在 主 隙 数 中 判断 应 该 从 文件 还 是 标准 输入 中 获取 数据 ,并 打开 相 
应 的 数据 源 ,然后 调用 do more 函数 ,do_more 将 数据 显示 在 显示 器 上 , 满 一 屏 后 ,调用 see 
more 图 数 接收 用 户 的 输 和 人 ,以 雇 定 下 一 步 的 动作 。 编 译 并 运行 上 述 代 码 ， 








$ cc moreül.c - o moreOl 


$ morel more(ü1.c 


这 个 程序 可 以 完成 基本 的 功能 ,显示 了 24 行 后 就 停 下 来 等 待 输 入 ,而 自在 屏幕 下 方 会 有 
RARR more? ' 当 按 回 车 键 后 会 显示 下 一 行 。 


但 是 问题 也 是 存在 的 , 当 屏幕 上 的 文字 上 滚 时 ,|more?] 也 会 随 之 上 滚 ,这 并 不 是 所 需要 
Ym SRSA IG RARE. RHA RRS, 

TAF VE 3E CE FRB TAAL AR PS: Unix 编程 不 是 很 
难 ,但 也 不 是 轻而易举 的 事情 。 

这 个 程序 的 目标 很 清晰 ,实现 算法 也 不 复杂 ,但 是 除了 算法 ,还 有 其 他 问题 需要 考虑 。 

接 下 来 有 这 样 一 些 问题 , 如 何 使 得 不 用 回 车 ,程序 就 得 到 输入 ? 如 何 计算 显示 的 百 分 
Eb? 如 何 去 掉 友和 白 的 [more?]? 

先 来 看 对 数据 源 的 处 理 , 在 main 函数 中 检查 命令 参数 的 个 数 ,如 果 没 有 参数 , 那 就 从 标 
准 输 入 读 取 数据 ,这 样 一 来 more 就 可 以 通过 管道 重 定向 来 得 到 数据 ,如 ， 














$ who | more 


who 命令 列 出 当前 系统 中 活动 的 用 户 , 管 道 命 令 “|” 将 who 的 输出 重 定向 到 more 的 输 
入 :结果 是 每 次 显示 24 个 用 户 后 暂停 ,在 有 很 宅 用 户 的 情况 下 ,用 more 来 对 who 的 输出 进 
行 分 页 就 会 很 有 必要 ， 

接 下 来 是 输入 重 定向 的 问题 ,看 以 上 例子 : 


$ ls /bin  moreQl 


期 望 的 结果 是 将 /bin 目录 下 的 文件 分 页 ,显示 24 行 以 后 暂停 。 

然而 实际 的 运行 结 代 并 不 是 这 样 的 ,24 行 以 后 并 没有 暂停 而 是 继续 输出 ,问题 在 哪 
Hu? 

“4 more01 读 人 第 24 后 ; 它 打印 了 [more 引 ,然后 等 竺 用 户 的 输入 。 

用 户 的 输入 是 从 哪里 来 的 ? 在 more] 中 用 getchar O , 它 是 从 标准 输入 读数 据 的 ,问题 
就 在 这 里 。 刚 才 的 命令 ， 





$ ls /bin | nore0i 


已 经 将 more01 的 标准 输入 重 定向 到 ls 的 标准 输出 ,这样 more01 将 从 同一 个 数据 流 中 读 用 





。20 。 Unix/Linux 编程 实践 教程 





户 的 输入 ,这 显然 有 问题 ,图 1. 14 描述 了 这 种 状况 。 





图 1. 14 more 从 标准 输入 读数 据 


解决 这 个 问题 的 方法 是 ,从 标准 输入 中 读 入 要 分 页 的 数据 ,直接 从 键盘 读 用 户 的 输入 ， 
如 图 1. 15 所 示 。 





图 1.15 more 从 键盘 读 用 户 的 输入 


图 1. 15 中 有 一 个 文件 /dev/tty, 这 是 键盘 和 显示 器 的 设备 描述 文件 ,向 这 个 文件 写 相 当 
于 显示 在 用 户 的 屏幕 上 , 读 相当 于 从 键盘 获取 用 户 的 输入 。 即 使 程序 的 输入 /输出 被 “二 ”或 
“二 ” 重 定向 ,程序 还 是 可 以 通过 这 个 文件 与 终端 交换 数据 。 

从 图 1. 15 中 可 以 知道 ,more 有 两 个 输入 ,程序 的 标准 输入 是 ls 的 输出 ,将 其 分 页 显示 
到 屏幕 上 , 当 more 需要 用 户 输入 时 , 它 可 以 从 /dev/tty 得 到 数据 。 

运用 上 述 知 识 改 进 more01. c, 得 到 more02. c: 


/ # more02.c — version 0.2 of more 

* read and print 24 lines then pause for a few special commands 
* feature of version 0.2; reads from /dev/tty for commands 
x/ 

# include <stdio. h> 

+ define PAGELEN 24 

# define LINELEN 512 

void do more(FILE * ); 


int see more(FILE x»); 


int main( int ac, char * av[] ) 
{ 
FILE * fp; 
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if (ac == 13 
do more( stdin ); 
else 
while ( —— ac ) 
if ( (fp - fopen( * + tav, "r^ )) |= NULL) 
{ 
do_moret fp); 
fclose( fp; 
} 
else 
exit{1}; 
return 0; 


} 


void do more( FILE + fp) 

fe 

* read PAGELEN lines, then call see more() for further instructions 

xf 

1 
char line| LINELEN ] ; 
int num of lines - 0; 
int see more(FILE =), reply; 
FILE x fp tty; 


fp tty = fopen( "/dev/tty", "r" ); /* NEW; cmd stream «/ 
if ( fp tty == NULL} /* if open fails #/ 
exit(1); /* no use in running #/ 
while ( fgets( line, LINELEN, fp ) }{ /* more input «/ 
if ( num of lines == PAGELEN ) | /* full screen? */ 
reply = see more(fp tty); /* NEW; pass FILE « «/ 
if ( reply == 0) /* ni done x/ 
break; 
num of lines ~= reply; /* reset count */ 
} 
if ( fputs( line, stdout } == EOF 》 /* show line x/ 
exitt1); /* or die »/ 
num of lines ++ ; /* count it +/ 
i 
} 
int see_more(FILE x cmd) /* NEW; accepts arg */ 


fs 
# print message, wait for response, return # of lines to advance 
* q means no, space means yes, CR means one line 
xf 

{ 


int c; 
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printf("\033[7m more? \033[m") ; /* reverse on a vt100 x/ 
while( (c7 getc(cmd)) ! = EOF ) /* NEW; reads from tty «/ 
{ 
if (c == 'q') /xq -> Nx/ 
return 0; 
if (c == '') /* | * => next page */ 
return PAGELEN; /* how many to show */ 
if (c == "Wn') /* Enter key => 1 line «/ 
return 1; 
} 
return 0; 
} 
编译 并 测试 新 的 程序 : 


$ cc - o more02 more02.c 
$ ls /bin | more02 


more02, c 可 以 从 标准 输入 得 到 数据 ,也 可 以 从 键盘 得 到 用 户 的 输入 ,同时 通过 编写 
more02. c, 增 加 了 对 文件 /dew/tty 的 了 解 。 

more02. c 还 需要 进一步 完善 , 当 用 户 按 空格 键 或 输入 “q” 后 ,还 得 按 回 车 键 ,程序 才 会 动 
作 , 而 且 输 入 的 字符 会 显示 出 来 。 实 际 的 more 是 不 需要 额外 的 回 车 的 ,而 且 输 入 的 字符 也 
不 会 回 显 。 

3. 对 输入 的 进一步 处 理 

用 户 操作 的 终端 有 很 多 参数 ,可 以 调整 参数 使 得 用 户 输 入 的 字符 被 立即 送 到 程序 ,而 不 
用 等 待 回 车 ,还 可 以 使 输入 的 字符 不 回 显 , 如 图 1. 16 所 示 。 





Z 


图 1.16 终端 参数 是 可 调 的 


1. 16 中 新 加 入 部 分 是 用 于 调整 终端 参数 的 ,程序 运行 的 时 候 可 以 动态 地 调整 终端 的 
参数 。 

要 编写 一 个 完善 的 more 还 有 很 多 工作 要 做 ,以 下 是 留 给 读者 的 问题 。 如 何 知道 文件 中 
已 显示 的 百分比 ? 要 知道 百分比 就 必须 知道 文件 的 大 小 ,这 些 信息 操作 系统 是 提供 的 ,需要 
用 合适 的 系统 调用 来 得 到 。 如 何 反 白 显示 文字 ? 如何 确 定 每 一 页 的 行 数 ? 这些 都 跟 终端 类 
型 有 关 , 如 果 将 每 一 页 定 为 24 行 、 终 端 类 型 定 为 vt100, 那 么 程序 就 缺乏 足够 的 灵活 性 。 如 
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何 使 程序 能 够 处 理 各 种 类 型 的 终端 ? 那 就 需要 学 习 如 何 控制 和 调整 终端 参数 的 知识 。 


1.7 工作 步骤 与 概要 图 


1.7.1 接 下 来 的 工作 步骤 


Unix 系统 是 一 个 多 用 户 系 统 , 它 允许 很 多 用 户 很 多 程序 同时 工作 ,程序 经 常 对 文件 、 目 
录 进 行 操作 ,对 数据 进行 转换 或 传输 。 同 一 台 机 器 上 的 不 同 程序 之 间 , 甚 至 不 同 机 器 上 程序 
之 间 通 过 网 络 都 可 以 互相 通信 。 

这 么 多 复杂 的 程序 ,它们 的 功能 是 什么 ? 是 如 何 工 作 的 ? 在 中 间 操 作 系 统 做 了 些 什么 ? 
随 着 学 习 的 深入 ,这 些 问题 会 越 来 越 多 地 被 解答 。 

在 研究 more 的 过 程 中 展示 了 解决 问题 的 步骤 ,首先 分 析 一 个 实际 存在 的 程序 , 弄 清 它 
的 功能 ,分 析 它 的 实现 原理 ,然后 自己 编写 一 个 。 通 过 对 程序 的 不 断 完 善 来 更 多 地 了 解 Unix 
系统 和 它 的 工作 原理 。 这 也 是 本 书 采 用 的 主要 方法 。 


1.7.2 Unix 的 概要 图 
Unix 的 结构 如 图 1.17 所 示 。 





图 1.17 Unix 系统 的 主要 结构 


1.17 描述 了 Unix 系统 的 主要 结构 ,内 存 被 分 为 系统 空间 和 用 户 空间 ,内 核 和 它 的 数 
据 结构 位 于 系统 空间 ,用 户 程序 位 于 用 户 空间 ,用 户 通过 终端 连接 到 系统 ,文件 存放 在 磁盘 
上 ,各 种 各 样 的 设备 被 内 核 直 接管 理 ,用 户 程序 可 以 通过 内 核 来 访问 设备 ,最 后 还 有 网 络 连 
接 , 用 户 可 以 通过 网 络 接 人 系统 。 

接 下 来 的 每 章 都 会 关注 系统 的 某 一 个 部 分 ,介绍 相关 的 系统 调用 逻辑 和 数据 结构 。 学 
完 本 书后 ,会 对 图 1. 17 中 每 一 个 部 分 都 有 所 了 解 ,应 该 能 够 编写 一 般 的 Unix 系统 程序 ,如 
网 络 桥牌 。 


1.7.3 Unix 的 发 展 历 程 


这 本 书 的 主要 内 容 是 介绍 Unix 的 系统 结构 和 相关 概念 ,以 及 如 何 编写 Unix 程序 ,你 可 
能 会 问 ,Unix 从 哪里 来 ? 它 是 怎么 发 展 的 ? 在 这 里 简要 地 介绍 Unix 的 发 展 历程 。 

1969 年 ,贝尔 实验 室 的 计算 机 科学 家 发 明了 Unix, 最 初 的 Unix 是 由 内 核 和 一 些 工具 组 
成 的 , 它 并 不 是 一 个 商业 产品 ,实际 上 在 20 世纪 70 年 代 , 贝 尔 实验 室 向 大 学 和 研究 机 构 提供 
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Unix, 包 括 完整 的 源 代码 , 仅 收 取 象 征 忻 的 费用 ,贝尔 实验 室 以 及 其 他 的 计算 机 科学 家 不 断 
地 改进 Unix。 到 1980 年 ,一 些 公司 发 布 了 商用 的 Unix, 这 时 的 Unix 主要 分 为 两 个 系列 ,一 
个 是 AT& 了 公司 的 System V, 另 一 个 是 加利福尼亚 大 学 伯克利 分 校 的 BSD, 大 多 数 的 Unix 
MAS ENT Unix 版 本 。 几 年 后 ,伯克利 停止 了 BSD 的 研究 ,System V 则 被 销售 给 了 其 . 
fu 

Unix 在 商业 计算 种 研究 机 构 得 到 很 大 的 发 展 , 出 现 了 不 则 的 方向 ,如 有 些 Unix 的 实时 
性 就 很 出 众 。 虽 然 各 种 Unix 不 尽 相同 ,但 Unix 的 核心 架构 和 其 主要 系统 调用 却 可 以 保持 
稳定 ,1980 年 AT& T ff) Unix 与 1991 FERR FEEF A) Unix 会 有 很 大 不 局, 但 1980 年 
编写 的 Unix 程序 稍 加 修改 就 可 以 在 1991 年 的 Unix 上 运行 。 

那么 什么 是 Unix W? 只 要 有 与 这 些 版 本 类 位 的 结构 和 运行 特性 ,提供 应 有 的 系统 服 
务 , 那 就 是 Unix。 由 于 不 同 机 构 对 Unix 的 不 断 发 展 ,现在 有 些 系统 看 起 来 很 像 Unix. Ue 
代码 里 却 看 不 到 System V 或 USB 的 影子 ,如 GNU/Linux, POSIX 标准 中 用 形式 化 的 方法 
描述 了 Unix 的 系统 接口 ,但 是 要 了 解 Unix, 单 单一 个 标准 是 不 够 的 。 

Unix 有 很 长 的 发 展 历 史 和 不 同 的 版 本 ,所 以 ,一 本 书 所 能 涵盖 的 是 十 分 有 限 的 。 本 书 只 
描述 了 不 同 的 Unix 共有 的 原理 ,技术 和 结构 ,各 个 不 同 版 本 的 Unix 的 特点 并 不 在 本 书 介 绍 
的 范畴 内 。 

你 可 能 工作 在 SunOS 上 ,也 可 能 在 AIX 或 其 他 的 Unix 平台 上 ,关于 特定 平台 的 知识 可 
以 参考 所 使 用 平台 的 联机 帮助 ,实际 上 对 本 书 的 学 习 很 大 程度 上 要 借助 联机 帮助 ， 

要 是 注意 的 话 就 会 发 现 ,有 时 蛋 一 项 功能 可 以 用 不 同 的 函数 来 实现 ,这 有 两 个 原因 。 一 
是 Unix 是 由 不 同 的 机 构 完 善 的 ,如 AT&T 和 BSD, 对 于 同一 个 要 解决 的 问题 ,他 们 采用 了 
不 同 的 函数 名 来 实现 。 另 一 个 原因 是 Unix 自身 的 发 展 需 要 兼容 , 当 有 一 -个 新 的 服务 可 以 普 
代 老 的 服务 时 ,人 们 并 不 会 把 老 的 系统 调用 去 掉 , 而 是 增加 新 的 系统 调用 ,这 就 使 以 前 编写 
的 程序 也 可 以 峰 利 地 运行 。 在 本 书 中 也 有 这 样 的 情况 ,可 以 用 不 同 的 沙 数 来 做 同一 件 事 情 ， 
作为 系统 程序 员 ,这 是 经 常 的 和 不 可 避免 的 。 




















小 结 


计算 机 系统 中 包含 了 很 多 系统 资源 ,如 硬盘 ,内 存 、 外 国 设 备 , 网 络 连 接 等 ,程序 利用 
这 些 资 源 来 对 数据 进行 存储 、 转 换 和 处 理 。 

ZAP RSE} PREM. Unix 的 内 核 就 是 这 样 的 程序 , 它 可 以 对 程序 和 
资源 进行 管理 。 

用 户 程序 要 访问 设备 必须 经 过 内 核 。 

一 些 Unix 的 系统 功能 是 由 多 个 程序 的 协作 而 实现 的 ， 

要 编写 系统 程序 ,必须 对 系统 调用 和 相关 的 数据 结构 有 深入 的 理解 。 


#25 用户、 文件 操作 与 联机 帮助 : 
编写 who 命令 





概念 与 技巧 

联机 帮助 的 作用 与 使 用 方法 

Unix AY SCE REE PK: open, read, write, Iseek , close 
文件 的 建立 与 读 写 

文件 描述 符 

缓冲 : 用 户 级 的 缓冲 与 内 核 级 的 缓冲 

内 核 模式 、 用 户 模式 和 系统 调用 的 代价 

Unix 表示 时 间 的 方法 与 时 间 格 式 间 的 转换 

借助 utmp 文件 来 列 出 已 登录 的 用 户 


。 系统 调用 中 的 错误 检测 与 处 理 
相关 的 系统 调用 
* open,read,write,creat,lseek,close 
* perror 
相关 命令 
* man 
* who 
。 cp 
* login 
2.1 iff 2H 


在 使 用 Unix 的 时 候 , 经 常 需要 知道 有 哪些 用 户 正 在 使 用 系统 ,系统 是 否 很 繁忙 , 某 人 是 
否 正在 使 用 系统 等 。 为 了 回答 这 些 问题 ,可 以 使 用 who 命令 ,所 有 的 多 用 户 系统 都 会 有 这 个 
命令 。 这 个 命令 会 显示 系统 中 活动 用 户 的 情况 。 接 下 来 的 问题 是 , who 命令 是 如 何 工作 
的 呢 ? 
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本 章 分 析 Unix 中 的 who 命令 ,通过 分 析 来 学 习 Unix 的 文件 操作 。 除 此 之 外 ,还 将 学 习 
如 何 从 Unix 的 联机 帮助 中 得 到 有 用 的 信息 。 


2.2 关于 命令 who 


下 面 给 出 了 Unix 系统 的 概览 图 ,如 图 2.1 所 示 。 





图 2,1 用 户 、 文 件 . 进 程 .设备 和 内 核 


图 2. 1 中 最 大 的 长 方 体 代 表 计 算 机 内 存 , 它 被 分 为 用 户 空间 和 系统 空间 ,用 户 通 过 终端 
连接 到 系统 ,一 大 一 小 两 个 柱状 体 代 表 两 个 硬盘 ,系统 中 还 有 一 个 打印 机 。 靠 上 方 的 3 个 较 
小 的 长 方 体 代 表 3 个 应 用 程序 ,它们 运行 在 用 户 空间 ,通过 内 核 与 外 界 进行 通信 ,应 用 程序 和 
内 核 之 间 的 连 线 代表 通信 管道 。 

本 章 的 第 一 个 程序 通过 对 以 下 3 个 问题 的 解答 来 学 习 who 命令 : 

1. who 命令 能 做 些 什么 ? 

2. who 命令 是 如 何 工 作 的 ? 

3. 如 何 编写 who? 


命令 也 是 程序 


在 开始 之 前 ,需要 声明 的 是 ,在 Unix 系统 中 ,几乎 所 有 的 命令 都 是 人 为 编写 的 程序 ,如 
who 和 ls, 而 且 它们 中 的 大 多 数 都 是 用 C 语言 写 的 。 当 在 命令 行 中 输入 ls,Shell( 命 令 解 释 
器 ) 就 知道 你 想 运 行 名 字 为 ls 的 程序 。 如 果 对 ls 所 提供 的 功能 还 不 满意 ,完全 可 以 编写 和 使 
用 自己 的 1s q^. 

在 Unix 系统 中 增加 新 的 命令 是 一 件 很 容易 的 事 。 把 程序 的 可 执行 文件 放 到 以 下 任意 
一 个 目录 就 可 以 了 : /bin,/usr/bin,/usr/local/bin, 这 些 目录 里 面 存 放 着 很 多 系统 命令 。 
Unix 系统 中 一 开始 并 没有 这 么 多 的 命令 ,一 些 人 编写 程序 用 来 解决 某 个 特定 的 问题 ,而 其 他 
人 也 觉得 这 个 程序 很 有 用 , 随 着 越 来 越 多 的 使 用 ,这 个 程序 就 逐渐 成 了 Unix 的 标准 命令 。 
说 不 定 哪 一 天 ,你 编写 的 程序 也 会 成 为 标准 命令 。 
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2.3 ”问题 1: who 命令 能 做 些 什 么 


如 果 想 要 知道 都 有 谁 正 在 使 用 使 用 系统 ,只 有 输入 who 命令 ,输出 如 下 : 





$ who 

heckerl  ttypl Jul 21 19:51 (tide75.surfcity. com) 

nlopez ttyp2 Jul 21 18:11 (roam163 - 141.student. ivy. edu) 
dgsulliv ttyp3 Tul 21 14;18 (h004005aB8bd64. ne, mediaone. net) 
ackerman ttyp4 Jul 15 22:40 (asdl- 254. fas. state, edu) 
wwchen — ttyp5 Jul 21 19:57 (circle. square. edu} 

barbier ttyp6 Jul 8 13:08 (labpcl8.elsie. special. edu) 
ramakris ttyp? Jul 13 08:51 (roam157 - 97. student. ivy. edu) 
ezhu ttyp8 Jul 21 12:47 (spa. sailboat. edu) 

bpsteven ttyp9 Jul 21 18:26 (207.178.203. 990 

molay ttypa Jul 21 20:00 (xyz73 — 200. harvard. edu) 

$ 


每 一 行 代表 一 个 已 经 登录 的 用 户 , 第 1 列 是 用 户 名 ,第 2 A ERRA, HS 列 是 登录 时 
IRI ,第 4 列 是 用 户 的 登录 地 址 , 某 些 版 本 的 who 命令 在 默认 状态 下 不 给 出 第 4 列 的 内 容 。 


阅读 手册 


通过 直接 运行 命令 ,可 以 了 解 who 的 大 致 功能 ,要 进一步 了 解 who BRE t EE EC 
机 帮助 。 

每 一 个 Unix 在 发 售 的 时 候 都 会 带 上 大 量 的 有 关 各 个 命令 使 用 方法 的 文档 。 以 前 ,这 些 
文档 是 打印 出 来 的 ,现在 有 电子 版 的 可 供 使 用 。 查 看 联机 帮助 的 命令 是 man, 如 要 查看 who 
的 帮助 ,可 输入 、 








$ man who 
whbotcli? 
NAME 
who — Identifies users currently logged in 
SYNOPSIS 
who [| — a] |[ - AbdhH1lmMpgqrstTu] [file] 
who am i 
who am I 
whoami 


The who command displays information about users and processes on the local aystem. 
STANDARDS 


Interfaces documented cn this reference page conform to industry standards as follows: 
who: XPG4, XPG4 ~ UNIX 
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Hefer to the standards(5) reference page for more information about industry standards and 


associated tags. 
OPTIONS 


-a Specifies all options; processes /var/adm/utmp or the named file with all options on. 
Equivalent to using the - b, - d, - 1, —p, -r, -t, —T, and -u options. 
more(10% ) 


所 有 命令 的 联机 帮助 都 有 相同 的 基本 格式 ,从 第 1 行 可 以 知道 这 是 关于 哪个 命令 的 帮 
助 , 还 可 以 知道 这 个 帮 月 是 位 于 哪 一 节 的 。 在 这 个 例子 中 ,从 第 1 行 的 内 容 who(1), 可 以 知 
道 这 是 who 命令 的 帮助 , 它 的 小 节 编 号 是 l. Unix 的 联机 帮助 分 为 很 多 节 , 如 第 1 小 节 中 是 
关于 用 户 命 令 的 帮助 ,第 2 小 节 中 是 关于 系统 调用 的 帮助 ,第 5 小 节 中 是 关于 配置 文件 的 帮 
助 。 你 可 查看 一 下 Unix 系统 的 联 和 机 帮助 ,了 解 其 他 节 讲 述 的 内 容 。 

名 字 {NAME) 部 分 包含 命令 的 名 字 以 及 对 这 个 命令 的 简短 说 明 

概要 (SYNOPSYS) 部 分 给 出 了 命令 的 用 法 说 明 ,包括 命令 格式 ,参数 和 选项 列表 。 选 项 
指 的 是 一 个 短线 后 面 紧 跟 着 -个 或 多 个 英文 字母 ,如 -sa、 -Be, 命 令 的 选项 影响 该 命令 所 进 
行 的 操作 。 

在 联机 帮助 中 , 方 插 号 ([ -a]) 表 示 该 选项 不 是 一 个 必须 的 部 分 。 帮 助 中 指出 who 的 写 
ETT te who, RH who -a, 或 者 who -加 上 AbdhHimMpqrstTu 这 些 字 母 的 任意 组 合 ， 
命令 的 末尾 还 可 以 有 一 个 文件 参数 。 

从 帮助 中 可 以 知道 who 命令 还 有 其 他 3 种 形式 ， 


who am i 
who am I 


whoami 


从 联机 帮助 中 还 可 以 获得 上 述 形式 的 进 - 一 步 帮 助 。 

描述 CDESCRIPTION) 部 分 是 关于 命令 功能 的 详细 阐述 ,根据 命令 和 平台 的 不 同 ,描述 
的 内 容 也 不 同 ,有 的 简洁 .精确 ,有 的 包含 了 大 量 的 例子 。 不管 怎么 样 , 它 描述 了 命令 的 所 有 
功能 ,而 有 日 是 这 个 命令 的 权威 性 解释 。 

选项 (OPTIONS) 部 分 给 出 了 命令 行 中 每 一 个 选项 的 说 明 。 早 期 的 Unix 命令 的 功能 都 
很 简单 ,每 个 命令 只 有 一 黄 个 选项 ,但 随 着 时 间 的 推移 ,命令 的 功能 越 来 越 多 ,基本 上 每 个 选 
项 用 来 实现 - … 个 功能 ,所 以 选项 也 越 来 越 多 , 像 who 命令 就 有 很 多 选项 。 

参阅 (SEE AI.SO) 部 分 包含 与 这 个 命令 相关 的 其 他 主题 ， 有 些 帮助 还 有 BUG 部 分 。 


2.4 问题 2: who 命令 是 如 何 工作 的 


前 面团 到 who 命令 可 以 显示 出 当前 系统 中 已 经 登录 的 用 户 信息 ,联机 帮助 中 描述 了 
who 的 功能 和 用 法 ,现在 的 问题 是 : who 是 如 何 来 实现 这 些 功能 的 ? 
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你 可 能 会 认为 , 像 who 这 样 的 系统 程序 一 定 会 用 到 一 些 特殊 的 系统 调用 ,需要 高 级 管理 
员 的 权限 ,区 编 写 这 样 的 程序 得 要 花 很 多 钱 来 购 头 系统 开发 开具 ,包括 光盘 .参考 书 等 。 

实际 上 ,所 需 的 资料 都 在 系统 中 ,你 声 知 道 的 仅仅 是 如 何 找 到 这 些 资料 。 

1. 从 Unix 中 学 习 Unix 

以 下 4 项 技巧 会 有 助 于 你 的 学 习 : 

”阅读 联机 帮助 

。 搜索 联机 帮助 

*。 阅读 , h 文件 

。 从 参阅 部 分 (SEE AL.SO) 得 到 启示 

2， 阅 读 联 机 帮助 

以 who 为 例 ,在 命令 行 输入 如 下 命令 : 


$ man who 


翻 到 描述 部 分 ,如 此 是 在 SunOS 平台 上 ,可 以 看 到 如 下 内 容 ， 


DESCRIPTION 
The whe utility can list the user-s name, termina] line, login time, elapsed time since 
activity occurred on the line, and the process - ID of the command interpreter (shell) for 
each current UNIX system user. It examines the /var/adm/utmp file to obtain its information. 
If file is given, that file (which must be in utmp(4) format) is examined, Usually, file will 


be /var/adm/wtmp, which contains a history of all the logins since the file was last created. 


上 述 描 述说 明 , 已 登录 用 户 的 信息 是 放 在 文件 /var/adm/utmp 中 的 ,who 通过 读 该 文件 
获得 信息 。 可 以 通过 搜索 联机 帮助 来 了 解 这 个 文件 的 结构 信息 。 

3， 搜 索 联 机 帮助 

使 用 带 有 选项 一 F 的 man 命令 可 以 根据 关键 宇 搜 索 联 机 帮助 。 如 果 村 查找 “utmp” 的 入 
息 , 在 命令 行 输入 如 下 命令 : 


$ man 一 k utep 


endutent getutent (3c) 7 access utmp file entry 
endutxent getutxent (3c)  — access utmpx file entry 
gctutent getutent (3c) — access utmp file entry 
getutid getutent (3c) —- access utmp file entry 
getutline getutent (3c) - access utmp file entry 
getutmp getutxent (3c)  — access utmpx file entry 
getutmpx getutxent (3c) 一 access utmpx file entry 
getutxent getutxent (3c)  — access utmpx file entry 
getutxid getutxent (30)  - access utmpx file entry 
getutxline getutxent (3c) ~ access utmpx file entry 
pututline getutent (3c) - access utmp file entry 
pututxline getutxent (3c)  — access utmpx file entry 


setutent getutent (3c) ~ access utmp file entry 
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setutxent getutxent (3c) access utmpx file entry 
ttyslot ttyslot (3c) find the slot in the utmp fiie of the current user 
updwtmp getutxent (3c) access utmpx file entry 
updwtmpx getutxent (3c) access utmpx file entry 
utmp ubmp (4) utmp and wimp entry formats 
utmp2wtmp acct (1m) overview of accounting and miscellaneous accounting 
commands 
utmpd utmpd (1m) utmp and utmpx monitoring daemon 
utmpname getutent (3c) access utmp file entry 
utmpx utmpx (4) utmpx and wtmpx entry formats 
utmpxname getutxent (ic) access utmpx file entry 
wtmp utmp (4) | utmp and wtmp entry formats 
wtnpx utmpx (4) utmpx and wtmpx entry formats 
$ 


以 上 的 输出 是 在 SunDS 平 台 上 的 输出 ,不 同 版 本 的 Unix 和 输出 可 能 会 有 所 木 同 ,其 中 每 
一 行 都 包含 帮助 的 主题 .标题 和 一 段 简短 的 描述 。 注 意 这 一 行 : 


utmp  utmp (4) - utmp and wtmp entry formats 


看 起 来 好 像 就 是 所 需要 的 。 这 一 行 里 的 “4” 是 小 节 编 号 ,说 明 该 帮助 是 位 于 第 4 节 ,在 查 
看 该 帮助 内 容 的 时 候 ,注意 别 把 小 节 编 号 沽 了 ， 


5 man 4 utmp 
utmp(4) 
NAME 
utmp, wtmp - Login records 
SYNOPSIS 
# include <lutmp. hz 
DESCRIPTION 
The utmp file records information about who is currently using the system. 


The file is a sequence of utmp entries, as defined in struct utmp in the utmp. h File. 


The utmp structure gives the name of the special file associated with the users terminal, the 
users login name, and the time of the login in the form of time(3), The ut type field is the type 
of entry, which can specify several symbolic constant values. The symbolic constants are 
defined in the utmp. h file. 


The wimp file records all logins and logouts. A null user name indicated a logout on the 
associated terminal. A terminal referenced with a tilde (~) indicates that the system was 
rebooted at the indicated time. The adjacent pair of entries with terminal names referenced bya 
vertical bar (|) or a right brace (}} indicate the system — maintained time just before and just 
after a date command has changed the systems time frame. 

The wtmp file is maintained by login(1) and init(B). Neither of these programs creates the 


file, so, if it is removed, record keeping is turned off, See ac(8) for information on the file. 
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FILES 
/usr/include/utmp.h 
/var/adm/utmp 

more(B8 X) 


到 此 已 经 离 目 标 不 远 了 ，whe 的 联机 帮助 说 明 who S it utmp 这 个 文件 ,进一步 ,从 以 
上 的 说 明 可 以 知道 utmp 这 个 文件 里 面 保 存 的 是 结构 数组 ,数组 元 素 是 utmp 类 型 的 结构 ,可 
以 在 utmp. h 中 找到 utmp 类 型 的 定义 , 接 下 来 的 问题 是 : utmp. h 这 个 文件 在 哪里 ? 

阅读 以 土 帮助 ,可 以 在 FILES 部 分 找到 utmp. h 这 个 文件 的 位 置 , 在 /usr/inelude A 
录 里 。 

在 进行 下 一 步 (分 析 . h 文件 ) 之 前 ,还 有 些 东 西 要 引起 注意 ,上 述 帮 助 提 到 wimp 这 个 文 
件 记录 了 关于 痘 录 和 注销 的 信息 , 它 涉及 到 以 下 几 个 命令 : login(1) ,init(8) 和 ae(8) ,这 些 命 
令 将 在 以 后 的 章节 讲 到 ， 

通过 联机 帮助 来 学 习 Unix 就 像 在 网 络 上 寻找 信息 一 样 , 经 常 能 从 某 一 个 帮助 主题 中 找 
到 相关 信息 ,链接 到 其 他 有 用 或 有 趣 的 主题 。 言 归 正 传 , 接 下 米 分 析 <utmp. hx f. 

4， 阅 读 .h 文件 

从 utmp 的 联机 帮助 中 可 以 知道 , utmp 中 的 数据 结构 定义 在 /usr/include/utmp. h rf, 
在 Unix 系统 中 ,大 多 数 的 头 文件 都 存放 在 /usry/include 这 个 目录 里 , 当 C 语言 编译 器 在 源 程 
序 中 发 现 如 下 的 定义 ， 


# include «;stdio. h> 


它 会 到 /usr include 中 寻找 相应 的 头 文件 。 接 下 来 用 more 命令 来 查看 这 个 文件 的 内 容 ， 


$ more /usr/include/utmp.h 


# define UTMP FILE "/var/adm/utmp" 

f define WIMP FILE "/var/adn/wtup" 

# include <(sys/types. h> /* for pid t, time t «/ 
fs 


* Structure of utmp and wtmp files. 

* 

* Assuming these numbers is unwise. 

af 

# define ut_name ut_user /* compatibility «/ 


struct utmp { 


char ut user[32]; /* User login name «/ 

char ut id[i4]; /* fete/inittab id- IDENT LEN in init «/ 
char ut line[32]; /* device name(console, Ime) »/ 

short ut type; /* type of entry «/ 

pid t ut pid; /* process id x/ 


struct exit status { 


short e termination; /* Process termination status x/ 
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short e exit; /* Process exit status */ 
) ut exit; /* The exit status of a process marked as DEAD PROCESS */ 
time t ut time; /* Time entry was made x / 
char ut host[64]; /* Host name same as MAXHOSTNAMELEN x / 
he 
/* Definitions for ut type */ 
utmp. h(60 % ) 


略 过 所 有 介绍 性 的 内 容 , 直 接 来 看 utmp 结构 所 保存 的 登录 记录 。 它 包含 8 个 成 员 变 
量 ,ut_user 数组 保存 登录 名 ,ut_line 数组 保存 设备 名 ,也 就 是 用 户 的 终端 类 型 ,ut_time 保存 
登录 时 间 ut host 保存 用 户 用 于 登录 的 远程 计算 机 的 名 字 。 

utmp 这 个 结构 所 包含 的 其 他 成 员 没 有 被 who 命令 所 用 到 。 

各 个 平台 上 的 utmp 结构 可 能 不 会 完全 相同 ,具体 的 内 容 由 utmp. h 来 决定 。 从 成 员 变 
BRA, 其 中 的 绝 大 部 分 字段 在 大 多 数 的 Unix 平台 上 是 相同 的 ,被 标记 为 兼容 
(compatibility) 的 行 更 可 能 出 现 不 同 。 通 常 头 文件 中 的 注释 提供 了 一 些 有 用 的 信息 。 


who 的 工作 原理 


通过 阅读 who 和 utmp 的 联机 帮助 ,以 及 头 文件 /usr/include/utmp. h, 可 以 知道 who 的 
工作 原理 ,who 通过 读 文 件 来 获得 需要 的 信息 ,而 每 个 登录 的 用 户 在 文件 中 都 有 对 应 的 记 
录 。who 的 工作 流程 可 以 用 图 2. 2 来 表示 。 


打开 utmp 


读 取 记录 
Cases | 


关闭 utmp 





图 2.2 who 命令 的 数据 流 


文件 中 的 结构 数组 存放 登录 用 户 的 信息 ,所 以 直接 的 想法 就 是 把 记录 一 个 一 个 地 读 出 
并 显示 出 来 ,是 不 是 就 这 么 简单 呢 ? 

虽然 没有 看 过 who 的 源 代 码 , 但 从 联机 帮助 中 可 以 了 解 who 要 完成 的 功能 及 实现 原理 ， 
所 涉及 的 数据 结构 的 信息 也 可 以 从 头 文件 中 获取 。 接 下 来 是 实践 的 时 候 了 。 


2.5 问题 3: 如 何 编写 who 


接 下 来 要 编写 自己 的 who 程序 ,为 了 能 够 顺利 完成 ,需要 经 常 从 联机 帮助 中 获取 信息 。 
测试 程序 时 ,要 把 程序 的 输出 与 系统 who 命令 的 输出 做 比较 。 通 过 分 析 可 以 确认 ,在 编写 
who 程序 时 只 有 两 件 事情 是 要 做 的 : 
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”从 文件 中 读 取 数据 结构 
”将 结构 中 的 信息 以 合适 的 形式 显示 出 来 


2.5.1 问题 : 如 何 从 文件 中 读 取 数据 结构 


可 以 调用 gete 和 fgets 函数 从 文件 中 读 字符 或 字符 串 ,但 是 如 何 读 出 数据 结构 中 的 信息 
YE? 当然 可 以 用 getc BPP PME IA RR AMR. BROW KE 
出 整个 数据 结构 的 方法 。 

还 是 到 联机 帮助 中 寻找 管 案 , 可 以 找 那 些 与 file 和 read BA KAYA HY. man 命令 的 
选项 一 k( 根 据 头 键 字 查找 ?只 支持 一 个 关键 字 的 查找 。 在 我 的 系统 中 ,与 file 相关 的 主题 有 
537 个 ,如 果 一 个 一 个 地 来 着, 这 就 太 慢 了 ,可 以 借助 Unix 命令 grep 来 从 这 537 个 主题 中 查 
找 与 read 相关 的 主题 ， 


$ man -kfiie grep read 


 llseek (2) - reposition read/write file offset 
fileevent (n) -— Execute a script when a channel becomes readable or writable 
gftype (1) 一 translate a generic font file for humans to read 
lseek (2) - reposition read/write file offset 
macsave (1) Save Mac files read from standard input 
read (2) - read from a file descriptor 
readprofile (1) - a tool to read kernel profiling information 
scr dump, scr restore, scr init, ser set (3) — read (write) a curses screen 


from (to) a fila 


tee (1) - read from standard input and write to standard output and files 
$ 


其 中 最 有 可 能 的 是 read(2) ,其 他 的 看 起 来 都 不 像 , 所 以 进一步 地 看 read(2) 的 帮助 : 


$ man 2 read 
REAIX 2) System calls READ( 2} 
NAME 
Read — read from a file descriptor 
SYNOPSIS 


# include <Cunistd. hz 
ssize_t read(int fd, void x buf, size t count); 

DESCRIPTION 
read() attempts to read up to count bytes from file descriptor fd into the buffer starting 
at buf. 
If count is zero, read{) returns zero and has no other results. If count is greater than SSIZE_ 
MAX, the result is unspecified. 

RETURN VALITF. 
On success, the number of bytes read is returned (zero indicates end of file), and the file 
position is advanced by this number. It is not an error if this number is smaller than the number 
of bytes requested; this may happen for example because fewer bytes are actually available 
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right now(maybe because we were close to end- of — file, or because we are reading from a pope, 
or from a terminal), or because read() was interrupted by a signal. On error, — 1 is returned, 
and errno is set appropriately. In this case it is left unspecified whether the file position(if 
any) changes. 


这 个 系统 调用 可 以 将 文件 中 一 定数 目的 字 节 读 和 人 一 个 缓冲 区 ,因为 每 次 都 要 读 人 入 一 个 
数据 结构 ,所 以 要 用 sizeof(struct utmp) 来 指定 每 次 读 人 的 字 节 数 。read 函数 需要 一 个 文件 
描述 符 作为 输入 参数 ,如 何 得 到 文件 描述 符 呢 ?在 read 的 联机 帮助 中 的 最 后 部 分 有 以 下 
描述 : 


RELATED INFORMATION(called SEE ALSO in some versions) 
Functions; fcntl(2), creat(2), dup(2), ioctl(2), getmsg(2), lockf(3), lseek(2), mtio(7), 
open(2), pipe(2), poll(2), socket(2), socketpair(2), termios(4),streamio(7),opendir(3), 
lockf(3) 
Standards; standards(5) 


其 中 包含 对 open(2) 的 引用 ,在 命令 行 输入 : 
$ man 2 open 


查看 open 的 联机 帮助 ,从 open 中 又 可 以 找到 对 close 的 引用 ,通过 阅读 联机 帮助 ,可 以 知道 
以 上 3 个 系统 调用 都 是 进行 文件 操作 所 必需 的 。 


2.5.2 ÆR: 使 用 open,read 和 close 


使 用 上 述 3 个 系统 调用 可 以 从 utmp 文件 中 取得 用 户 登录 信息 ,这 3 个 系统 调用 的 联机 
帮助 会 包含 很 多 内 容 , 尤 其 是 应 用 于 管道 .设备 和 其 他 数据 源 时 ,会 涉及 很 多 不 常用 的 选项 
以 及 复杂 的 用 法 ,但 在 这 里 ,只 需要 关心 它们 最 基本 的 用 法 。 

l. 打开 一 个 文件 : open 

这 个 系统 调用 在 进程 和 文件 之 间 建 立 一 条 连接 ,这 个 连接 被 称 为 文件 描述 符 , 它 就 像 一 
条 由 进程 通 向 内 核 的 管道 ,如 图 2. 3 所 示 。 


进程 
文件 描述 符 


字符 数组 





图 2.3 文件 描述 符 是 对 文件 的 连接 


open 的 基本 用 法 如 下 。 
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open 

目标 打开 一 个 文件 
Lx fF # include < fentl, h> 
函数 原型 int fd — open(char * name, int how) 
参数 name 文件 各 

how O_RDONLY, O_WRONLY, or O_RDWR 
ja [s] | —1 iA EIER 

int 战功 返回 








要 打开 一 个 文件 ,必须 指定 文件 名 和 打开 模式 ,有 3 种 打开 模式 ; RE RS .可 读 可 写 ， 
NXT BEF O RDONLY,O WRONLY,O RDWR 3x f 3L 3r (f /usr/include/fentl, h 中 有 
定义 。 

打开 文件 是 内 核 提供 的 服务 ,如 果 在 打开 过 程 中 内 核 检 测 到 任何 错误 ,这 个 系统 调用 就 
会 返回 一 1， 

错误 类 型 是 各 种 各 样 的 ,如 : 要 打开 的 文件 不 存在 。 即 使 文件 存在 ,也 可 能 因为 权限 不 
够 而 无 法 打开 ,或 者 是 无 权 访 问 文件 所 在 的 目录 。 在 open 的 联机 帮助 中 列 出 了 各 种 可 能 的 
错误 ,本 章 结 尾 还 会 进一步 讨论 出 错 处 理 的 问题 。 

当 一 个 文件 已 经 被 打开 ,是 否 允 许 再 次 打开 呢 ? 这 种 情况 发 生 在 有 多 个 进程 要 同时 访 
问 一 个 文件 的 时 候 。Unix 并 不 禁止 一 个 文件 同时 被 多 个 进程 访问 ,如 果 禁 止 的 话 , 那 两 个 用 
户 就 无 法 同时 使 用 who iT. 

如 果 文 件 被 顺利 打开 ,内 核 会 返回 一 个 正 整 数 的 值 ,这 个 数值 就 叫做 文件 描述 符 。 刚 才 
讲 过 ,打开 文件 会 建立 进程 和 文件 之 间 的 连接 ,文件 描述 符 就 是 用 来 惟一 标识 这 个 连接 的 ， 
如 果 同 时 打开 好 几 个 文件 ,它们 所 对 应 的 文件 描述 符 是 不 同 的 ,如 果 将 一 个 文件 打开 多 次 ， 
对 应 的 文件 描述 符 也 不 相同 。 

必须 通过 文件 描述 符 对 文件 进行 操作 。 

2. MER AGE: read 

JB TT read BA BOR Be OE read 的 用 法 如 下 ，; 


一 一-  _ o țOOħħħŘħŮĪO O 














read 
目标 把 数据 读 取 到 缓冲 区 
Shc EF # include < unisid, hz 
函数 原型 B ssize t numread = read(int fd, void * buf, size_t qty) 
参数 fd 文件 描述 符 


buf 用 来 存放 数据 的 日 的 缓冲 区 
| qty 要 读 取 的 字 节 数 
返回 值 —1 3B Bll IR 
numread A uh de Ry 
ee eee 
read 这 个 系统 调用 请 求 内 核 从 fd BAB B x PE RRR aty 宁 节 的 数据 ,存放 到 buf 
所 指定 的 内 看 空间 中 ,内 核 如 果 成 切 地 读 取 了 数据 .就 返回 所 读 取 的 字 节 数 日 ， 否则 返 
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[pn] — 1. 

这 里 有 个 问题 ,就 是 最 终 讯 到 的 数据 可 能 没有 你 所 要 求 的 那么 多 ,为 什么 呢 ? 可 能 是 因 
为 文件 中 剩余 的 数据 没有 要 求 的 那么 多 。 例 如 ;程序 要 求 读 1000 字 节 的 数据 ,而 文件 的 长 度 
A 500 个 字 节 ,那么 程序 就 只 能 读 到 500 字 节 。 当 读 到 文件 末尾 时 再 要 读 的 话 , numread 会 
是 0, 因 为 已 经 没有 数据 可 读 了 。 

润 用 read 函数 时 可 能 会 遇 到 的 错误 在 联机 帮助 中 有 详细 的 描述 。 

3, KH) XH: close 

当 不 需要 再 对 文件 进行 读 写 操作 时 ,就 要 把 文件 关闭 。clese 的 用 法 如 下 。 


























close 
目标 关闭 一 个 文件 
Lue f include << unistd. h> 
画 数 原型 int result = closetint fd 
参数 fd 文件 描述 符 
, -i JAB 
RAT 0 成 功 关闭 





close 这 个 系统 调用 会 关闭 进程 和 文件 fa 之 间 的 连接 ,如 此 关闭 的 过 程 中 出 现 错误 ， 
close 返回 一 1, 例 如 : fd 所 指 的 文件 并 不 存在 。 其 他 可 能 遇 到 的 错误 在 联机 帮助 中 有 详细 的 
描述 。 


2.5.3 编写 whol.c 


到 目前 为 止 ,已 经 离 目 标 很 近 了 ,明白 了 who 的 工作 原理 ,知道 了 要 先 打 开 文 件 ,然后 读 
数据 ,最 后 关闭 文件 ,以 及 上 述 操作 所 需要 的 系统 调用 ,这 样 可 以 编写 如 下 代码 ， 





/* whol.c - a first version of the who program 

* open, read UTMP file, and show results 
xf 

# include <istdio. h> 

# include <iutmp. h= 

# include —fentl, h> 

H include «unistd. k> 


dt define SHOWHOST /* include remote machine on output x/ 
int main(} 
i 

struct utmp current record; /* read infa into here «/ 

int utmpfd; /* read from this descriptor x/ 

int reclen = sizeof(current record); 

if ( (Cutmpfd = open(UTMP FTLE, O BDONLY)) == -— 1 ){ 


perror( UTMP FILE ); /* UTMP FILE is in utmp. h «/ 
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exit(15; 


上 
1 


while ( read(utmpfd, &current record, reclen) == reclen ) 


show into(&current record; 
close(utmpfd) ; 
return 0; 


} 


/* went ok #/ 


这 段 代码 应 出 了 前 面 学 到 的 肉 容 , 在 while 循环 内 从 文件 中 逐条 地 把 数据 读 取 出 来 , 存 
放 在 记录 current. record 中 ,然后 调用 函数 show. info 把 登录 信息 显示 出 来 ;, 当 文件 中 已 经 


没有 数据 时 .循环 结束 ,最 后 关闭 文件 返回 。 


这 里 调用 了 函数 perror, 这 是 一 个 系统 阻 数 ,使 用 这 个 函数 来 处 理 系 统 报错 ,关于 错误 处 


WARE RIBS. 
2.5.4 显示 登录 信息 


下 而 是 show info 的 第 一 个 版 本 , 它 的 功能 是 显示 utmp 记录 的 内 容 ; 


EE 


* show infol) 


* displays contents of the utmp struct in human readable form 


+ *note* these sizes should not be hardwired 


af 
show info( struct utmp x utbufp } 
{ 


printf("% -8. 8s", utbufp —ut name); 


printf(" "); 


printf(" $ -8.85", utbufp-—ut line); 


printf(" "), 
printf(" € 101d", utbufp -ut time); 
printf(" ">; 


# ifdef SHOWHOST 

printf("( $s)", utbufp —^ut host): 
# endif 

printf('Amn"): 
} 


/* the logname +«/ 
/* a space x/.- 

/* the tty «/ 

/* a Space «/ 

/* login time «/ 


/* a space «/ 
/* the host «/ 


/* newline x/ 


在 使 用 printf BE ZUR EH IRE. HE HIT XE SE BE BS Ei x C EE E Du SS ASE who 命令 的 输 
出 一 致 ,ut_time 字段 是 以 long int 的 格式 输出 的 ,在 头 文 件 中 这 个 字段 被 定义 为 time_t 类 
型 ,但 到 目前 还 不 知道 time t 类 型 的 数据 应 如 何 处 理 。 


将 上 述 代码 编译 .运行 : 


5 ec whol.c - o whol 
5 whol 
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LOGIN 


shpyrko 


acotton 


&pradlin 
dkoh 
spradlin 
king 
berschba 
rserved 
dabel 


r&erved 
dkoh 


molay 


cweiner 


system b 


run- leve 


console 
ttypl 
ttyp2 
ttyp3 
ttypd 
ttyps 
ttyp6 
ttyp? 
ttyp8 
EtypS 
ttypa 
ttypb 
ttypc 
ttypd 
ttype 
ttvpf 
ttyqo 
ttyqi 
Ltyg2 
ttyq3 
ttyg4 
ttygā 
ttyq6 
ttyq? 
ttyqé 
ttyqa 
ttygq9 


952601411 O0 

952601411 ¢) 

952601416 O 

952601416 O 

952601417 (5 

952601417 () 

252601418 (} 

352601419 () 

352601423 () 

952601566 () 

552601566 (0 

958240622 Q 

964318862 (nasl- 093.gas. swamp. org) 
964319088 (math - quest04. williams. edu) 
0643202838 (3 

9563881486 (h002078c6adfb. ne. rusty. net) 
964314388 (128.103.223.110) 

964058662 (h002078c6ad£b. ne. rusty, net) 
964279969 (blade - runner. mit. edu) 
964188340 (dudley. learned. edu) 
963538145 (gigue. eas, ivy. edu) 
964319455 (rcam193 — 27. student, state. edu) 
964319645 () 

963538287 (gigue. eas. ivy. edu) 
964298768 (128. 103. 223. 110) 

964314510 () 

964310621 (xyz73 — 200. harvard. edu) 
964311665 © 

964310757 (3 

9643042B4 (5 

964305014 ¢) 

964289803 () 

964219533 (> 

964215661 () 

964212019 (roam175 — 157. student. stats. edu) 
964277078 0) 

964231347 () 


将 上 述 输出 与 系统 who t$ BIS HB IOS HE. 


s who 
shpyrko 


acotton 


ttyp2 Jul 22 22:21 (nas1 - 093. gas. swamp. edu) 
ttyp3 Jul 22 22.24 (math - guest04. Williams, edu? 
spradlin ttyp5 Jul 17 20;51 (h002078c6adfb. ne. rusty. net) 
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dkoh ttyp6 Jul 22 21:06 (1258. 103. 223.110} 
spradiin ttyp? Jul 19 22:04 (h002078c6adfb. ne. rusty. net) 
king ttypB Jul 22 11,32 (blade ~ runner, mit. edu? 


berschba ttyp9 Jul 21 10:05 (dudley. learned. edu)? 

rserved ttypa Jul 13 21;29 (gigue. eas. ivy. edu) 

dabel ttypb Jul 22 22:30 (roam193 - 27. student. state, edu) 
rserved ttypd Jul 13 21:31 (gigue. eas. harvard. edu) 

dkoh ttype Jul 22 16:46 (126.103, 223.110) 

molay ttyq0 Jul 22 20-03 (xyz73 — 200. harvard. edu) 

cweiner ttyq8 Jul 21 16:40 (roam175 —- 157. student. stats. edu) 
$ 


自己 编写 的 who 已 经 可 以 工作 了 , 它 能 正确 显示 出 用 户 名 .终端 名 .远程 主机 名 ,但 跟 系 
统 的 who 比 起 来 还 不 完善 ,至少 在 两 处 有 问题 ， 

需要 改进 的 : 

。 消除 空白 记录 

* 正确 显示 登录 时 间 


2.5.5 编写 who2.c 


针对 版 本 1 的 两 个 问题 ,继续 编写 who 的 第 2 个 版 本 ,解决 问题 的 方法 还 是 通过 阅读 联 
机 帮助 和 头 文件 。 

1o HERE ERG 

系统 所 带 的 who 只 列 出 已 登录 用 户 的 信息 ,而 刚才 编写 的 whol 除了 会 列 出 已 登录 的 
AP ,还 会 显示 其 他 的 信息 ,而 这 些 都 来 自 于 utmp 文件 。 实 际 上 ump & & BUB £x 0 48 
息 ,其 至 那些 尚未 被 用 到 的 终端 的 信息 也 会 存放 在 utmp 中 ,所 以 要 修改 刚才 的 程序 ,做 到 能 
够 区 分 出 哪些 终端 对 应 活动 的 用 户 。 如 何 区 分 呢 ? 

一 种 简单 的 思路 是 过 涨 掉 那 些 用 户 名 为 空 的 记录 ,但 这 样 做 是 有 问题 的 ,如 刚才 的 输出 
中 ,用 户 和 名 为 LOGIN 的 那 一 行 对 应 的 是 控制 台 , 而 不 是 一 个 真实 的 用 户 。 最 好 有 一 种 方法 
能 够 指出 某 一 条 记录 确实 对 应 着 已 登录 的 用 户 , 

fE / usr/include/utmp. h BB AF PNE 


/* Definitions for ut type x/ 


# define FMPTY 0 
# define RUN LVL 1 
# define BOOT TIME 2 
# define OLD TIME 3 
d define NEW TIME 4 
Hdefine INIT PROCESS — 5 
# define LOGIN PROCESS 6 
# define USER PROCESS 7 
# define DEAD PROCESS 8 


/* Process spawned by "init" «/ 
/* A "getty" process waiting for login «/ 


/* À user process «/ 
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ump 结构 中 有 一 个 成 员 ut_rype, 当 它 的 值 为 ?7(USER_PRLCESS) 时 ,表示 这 是 一 个 已 
经 登录 的 用 户 。 根 据 这 一 点 ,对 原来 的 程序 做 以 下 修改 ,就 可 以 请 除 空白 行 ， 


show infot struct utmp x utbufp ) 


了 


if ( utbufp -ut type !- USER PROCESS } /* users only «/ 
return; 
printf("% - 8.8s", utbufp —^ut name); /* the username x/ 


2、 以 可 读 的 方式 显示 登录 时 间 
接 下 来 要 处 理 的 是 时 间 显 示 的 问题 ,要 把 时 间 以 易于 理解 的 形式 显示 。 还 是 需要 借助 
联机 帮助 和 头 文 件 。 在 联机 帮助 中 关于 时 间 的 主题 很 多 ,在 命令 行 输入 ， 


$ man - k tine 


会 返回 很 多 条 记录 ,我 党 在 某 个 Unix 系统 上 得 到 73 条 记录 ,而 在 另 一 个 Unix 系统 上 得 到 
了 897 条 。 当 然 可 以 用 着 眼珠 一 条 一 条 地 看 ,不 过 用 Unix 自 带 的 工具 米 过 滤 出 有 用 的 东西 
是 一 个 更 好 的 方法 。 以 下 是 丙种 过 涨 方法 ， 


5 man -k tine | grep transform 


$ man -k time | grep - i convert 


RERI Al /usr/include/time. h 这 个 头 文件 ,这 里 而 有 很 多 有 用 的 信息 。 

(1) Unix 存储 时 间 的 方式 : time t 数据 类 型 

Unix 中 时 间 是 用 一 个 整数 来 表示 的 , 它 的 数值 是 内 1970 年 1 月 1 日 0 时 开始 所 经 过 的 
秒 数 ,在 头 文件 time.h PALL FAR. 


typedef long int time t; 


存 情 时 间 的 结构 tme t 实际 上 就 是 long int, 

(2) 将 time t 显 示 出 来 : ctime 

ctime 将 表示 时 间 的 整数 值 转换 成 人 们 日 常 所 使 用 的 时 间 形 式 。 在 联机 帮助 的 第 3 节 有 
ctime 的 详细 说 明 : 


5 man 3 ctime 
CTIME(3) Linux Programmers Manual CTIME(3) 


NAME 


asctime, ctime, gmtime, localtime, mktime - transform binary date and time to ASCII 


SYNOPSIS 
# include «< time. h> 
char * asctime(const struct tm * timeptr); 
char * ctime(const time t * timep); 
struct tm * gmtime(const time t x timep); 


struct tm * localtime(const time t * timep); 
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time t mktime(struct tm + timeptr); 


extern char + tzname[2]; 
long int timezone; 


extern int daylight; 


DESCRIPTION 
The ctime(), gmtimet) and localtime() functions all take an argument of data type time t which 
represents calendar time. When interpreted as an absolute time value, it represents the number 


of seconds elapsed since 00;00:00 on January 1, 1970, Coordinated Universal Tine (UTC). 


The ctime() function converts the calendar time timep into a string of the form 


"Wed Jun 30 21:49:08 1993Xn" 


The abbreviations for the days of the week are Sun, Mon, Tue, Wed, Thu, Fri, and Sat. The 
abbreviations for the months are Jan, Feb, Mar, Apr, May, Jun, Jul, Aug, Sep, Oct, Nov, and Dec. 
The return value points to a statically allocated string which might be overwritten by 


subsequent calls to any of the date and time functions. The function also 


这 正 是 所 需要 的 ,在 ump 结构 中 有 一 个 time t 类 型 的 数据 ,而 最 终 需 要 的 是 类 似 于 以 
FRIAR 


Jun 30 21 :49 





LU 


ctime(3) BR T 32 dip A — d lat time c 的 指针 ,返回 的 时 间 字 符 串 类 似 于 以 下 格式 ， 


Wed Jun 30 21:49:08 1993Xn 


AR ANAAN AAA ADA 


注意 : 并 不 是 所 有 的 字符 串 内 容 都 需要 ,需要 的 是 其 中 用 "^ "标识 出 来 的 部 分 , 接 下 来 就 
很 容易 处 理 了 ,将 ctime 返回 的 字符 串 从 第 4 个 字符 开始 ,输出 12 个 字符 ， 





printf(" % 12.12s8",ctime(EL) + 4) 


3. 把 刚才 学 的 两 点 综合 起来 
现在 明白 了 和 如何 消除 空白 记录 和 和 如何 正确 地 显示 ut_time 中 的 时 间 值 ,可 以 着 手 重 新 编 
写 who2.c 如 下 : 


/* who2.c - read /etc/utmp and list info therein 


* ~ suppresses empty records 
* — formats time nicely 
af 


# include — «—stdio.h-— 
# include — «unistd, h> 
# include <Cutmp. h> 
# include — -—fcntl. h> 
# include etime. h> 





Re p epe un 





» 42° Unix/Linux 编程 实践 教程 





/* # define SHOWHOST x*/ 


void showtime(long); 


void show info(struct utmp * }; 


了 


int main() 
{ 
struct utmp uthuf; /* read info into here «/ 
int utmpfd; /* read from this descriptor +/ 
if ( (utmpfd = open(UTMP FILE, O RDONLY)) == -1{ 
perror(UTMP FILE), 
exit(1); 
} 
whilet read(utmpfd, &utbuf, sizeof(utbuf)) == sizeof(utbuf) ) 
show info( &utbuf ); 
close(utmpfd) ; 
return Q; 
} 
oe 
* show infol) 
* displays the contents of the utmp struct 
* in human readable form 
* * displays nothing if record has no user name 
EFi 


void show info( struct utmp * utbufp ) 
I 


if ( utbufp —-ut type !- USER PROCESS ) 


return; 


printf" $ -8.8s", utbufp —-ut name); /* the logname x/ 
printf(" "); /* a space «/ 
printf("% ~ 8,8s", utbufp---ut line); /* the tty «/ 
printf(r m; /* a space «/ 
showtime( utbufp —-ut time); /* display time x/ 


# ifdef SHORHOST 
if ( utbuftp ->ut_ host[0| 1= 'X0' ) 


printf(" ( & 5)", utbufp —-ut host); /* the host «/ 
# endif 
printf" n"); /* newline x/ 


void showtime( long timeval ) 
fe 


* displays time in a format fit for human consumption 
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* uses ctime to build a string then picks parts out of it 
* Note; %12.12s prints a string 12 chars wide and LIMITS 
* it to l2chars. 


af 


D 


char * cp 


cp = 


ctime(&timeval); 


/* to hold address of time x/ 

/* convert time to string +/ 

/* string looks like «/ 

/x Mon Feb 4 00:46:40 EST 1991 =/ 
/* 0123456789012345. »/ 


printf(" $&12.12s", cp t 4 2); /x pick 12 chars from pos 4 «/ 


4. MA who2.c 
为 了 使 于 对 比 , 先 关 掉 SHOWHOST 这 个 选项 ,编译 whol. c 将 其 结果 与 系统 所 带 的 
who 进行 比较 : 


$ cc who2.a - o who2 


S who2 
rlscott 
acoLLon 
spradlin 
spradlin 
king 
berschba 
rserved 
rserved 
molay 
cweiner 


mnabavi 


5 who 
rlscott 
acotton 
spradlin 
spradlin 
king 
berschba 
reserved 
rserved 
molay 
cweiner 
mnabavi 


$ 


ttyp2 Jul 23 01 
ttyp3 Jul 22 22 
ttyp5 Jul 17 20 
ttyp? Jul 13 22 
ttyp8 Jul 22 11 


ttyp9 Jul 21 10: 
:29 
ttypd Jul 13 21; 
;03 


ttypa Jul 13 21 


ttygO Jul 22 20 


ttyq8 Jul 21 16. 
:11 


ttyx2 Apr 1d 23 


ttyp2 Jul 23 01 
ttyp3 Jul 22 22 
ttyp5 Jul 17 20 


ttyp8 Jul 22 11 
ttyp9 Jul 21 10 
ttypa Jul 13 21 
ttypd Jul 13 21 
ttygO Jul 22 20 
ttyg8 Jul 21 16 





307 
324 
251 
704 
32 


05 


31 


40 


107 
:24 
:51 
ttyp? Jul 19 22; 
:32 
-05 
:29 
:31 
103 
:40 
ttyx2 Apr 10 23; 


11 
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将 who2 与 系统 的 who 对 比 … 下 ,除了 其 些 字段 的 宽度 有 些 不 同 外 ,其 他 的 都 完全 一 致 ， 
而 要 调整 宽度 也 是 很 容易 的 。 

这 里 的 who 只 列 出 了 3 个 字段 , 用 户 名 ,终端 类 型 和 登录 时 间 ,有 些 版 本 的 who 还 会 列 
出 用 户 所 在 主机 的 信息 ,这 个 功能 在 who? 中 通过 预 编译 选项 SHOWHOST 控制 , 


2.5.6 回顾 与 展望 


这 一 章 是 从 这 样 一 个 简单 的 问题 开始 的 : Unix 的 who 命令 是 如 何 工 作 的 7 接 下 来 分 3 
FE BAFA who 的 功能 ,然后 通过 联机 帮助 和 头 文件 知道 了 who 的 工作 原理 ,最 后 ,通过 
编写 自己 的 who 来 检验 对 知识 的 掌握 程度 。 

在 这 3 步 中 ,学习 了 如 和 何 使 用 联机 帮助 ,如 何 使 用 洋 文 件 , 了 解 了 记录 登录 信息 的 utmp 
文件 的 结构 ,知道 了 Unix 处 理 时 间 的 方式 ,学 会 了 通过 相关 主题 来 获取 信息 ;这些 知识 对 掌 
18 Unix 编程 是 很 重要 的 。 道 过 编写 程序 ,更 如 深化 了 对 知识 的 理解 和 掌握 。 


2.6 编写 cp( 谈 和 号) 
在 who 命令 中 介绍 了 如 何 读 文件 , 接 下 来 要 通过 cp 命令 来 学 习 如 何 写 文 件 。 
2.6.1 问题 1: ep 命令 能 做 些 什 么 











$ cp source ~ file target 一 file 


如 果 target - file 所 指定 的 文件 不 存在 ,cp 就 创建 这 个 文件 ,如 果 已 经 存在 就 覆盖 ,target 
-file HARS source file 相同 。 


2.6.2 问题 2: cp 命令 是 如 何 创建 / 重 写 文 件 的 


|l 创建 / 重 轨 文件 
创建 或 重 写 文件 的 一 种 方法 基 使 用 系统 调用 函数 creat, creat 的 用 法 如 下 : 
































creat 

目标 创建 / 重 写 一 个 文件 
Lee # include < fentl. hz» 
函数 原型 int fd = creat(char * filename, mode t mode} 
参数 filename XA 

mode Vim eek 
返回 值 一 1 DESDE: 

id 成 功 创建 


creat FNRA :个 名 为 filename HRP MRAP KARE RABE MRE 
经 存在 ,就 把 它 的 内 容 清空 ,把 文件 的 长 度 设 为 0。 
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如 果 内 核 成 功 地 创建 了 文件 ,那么 文件 的 许可 位 (permission bits) 被 设置 为 由 第 2 个 参 
数 mode 所 指定 的 值 ,如 ， 


fd = Creatf "addressbook", 0644); 


创建 一 个 名 为 addressbook 的 文件 ,如 果 文 件 不 存在 ,那么 文件 的 许可 位 被 设 为 
rw-r-T--《 参 见 第 3 章 )。 如 果 文 件 已 经 存在 , 它 的 内 容 会 被 清空 。 任 一 -种 情况 下 ,fd 都 会 是 
指向 addressbook 的 文件 描述 符 。 

2, EXE 

用 write 系统 调用 向 已 打开 的 文件 中 写 人 数据 。 

















write 
Ets 将 内 存 中 的 数据 写 人 文件 
j 头 立 忻 4 include «unisid, h> 
函数 原型 ssizo t result = write(int fd, void * buf, size t amt) 
参数 fd 文件 描述 符 
buf 内 存 数据 
ami 要 写 的 字 节 数 
返回 值 一 过 到 错误 


num written MOEA 


write 这 个 系统 调用 告诉 内 核 将 内 存 中 指定 的 数据 写 入 文件 ,如 果 内 核 不 能 写 人 或 写 入 
AM write 返回 一 1, 如 果 写 人 成 功 , 则 返回 写 人 的 字 节 数 。 

为 什么 实际 写 人 的 字 节 数 会 少 于 所 要 求 的 呢 ? 有 两 个 原因 ,第 一 个 是 有 的 系统 对 文件 
的 最 大 义 十 有 限制 ,第 二 个 是 磁盘 空间 接近 注 了 。 在 上 述 两 种 情况 下 ,内核 都 会 尽量 把 数据 
往 文件 中 写 ,并 将 实际 写 人 的 字 节 数 返 回 , 所 以 调用 write 后 都 必须 检查 返回 值 是 否 与 要 写 
人 的 相同 ,如果 不 同 , 就 要 采取 相应 的 措施 。 


2.6.3 问题 3: 如 何 编号 cp 
下 面 通过 编写 一 个 实际 的 cp 来 检查 对 知识 的 理解 ,程序 的 流程 如 下 ， 


open sourcefile for reading 
open copyfile for writing 
* —»read from source to buffer 一 一 eof? -+ 


| | write from buffer to copy | 


close sourcefile 一 一 一 一 -一 一 一 一 一 + 


close copyfile 


图 2.4 Bios T M B SESS RC BEBE fS] 
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图 2.4 通过 读 和 写 来 复制 文件 


文件 在 磁盘 上 ，, 源 文件 在 左边 ,右边 的 是 目标 文件 ,进程 在 用 户 空间 ,缓冲 区 是 进程 内 存 
的 一 部 分 ,进程 有 两 个 文件 描述 符 ,一 个 指向 源 文 件 , 一 个 指向 目标 文件 ,从 源 文件 中 读 取 数 
据 写 人 缓冲 ,再 将 缓冲 中 的 数据 写 人 目标 文件 。 下 面 就 是 实现 上 述 逻 辑 的 代码 : 


/** cpl.c 
* version 1 of cp - uses read and write with tunable buffer size 
* 
* usage: cpl src dest 
x/ 
#include <stdio.h> 
# include <unistd.h> 
# include <fentl. h> 


# define BUFFERSIZE 4096 
# def ine COPYMODE 0644 


void oops(char * , char *); 


main(int ac, char * av[]) 
( 
int in fd, out fd, n chars; 


char buf [BUFFERSIZE]; 
/* check args */ 


if (ac != 3 ){ 
fprintf( stderr, "usage: % s source destination\n", xav); 
exit(1); 
} 
/* open files */ 
if ( (in_fd=open(av[1], O RDONLY)) == -1) 


oops( "Cannot open ", av[1]); 


if ( (out fd= creat( av[2], COPYMODE)) == -1) 
oops( "Cannot creat", av[2]); 


/x copy files x/ 
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while ( (n chars = read(in fd , buf, BUFFERSIZE)) — 0) 
if ( write( out fd, buf, n chars ) !- n chars ) 
cops "Write error to ", av[2]5; 
if(n chars == -1)} 
oops("Read error from ", av[1]); 


/* close files «/ 


if ( close(in fd) == -1 || close(out_fd) == -1) 
oops("Error closing files",""); 
i 
void oops(char * s1, char * 82) 
i 
fprintf(stderr, "Error: %s ", sl); 
perror(s2); 
exit(1); 


1 
J 


编译 并 测试 上 述 代 码 : 


5 cc cpl.c -o cpl 

$ cpl cpl copy, of. cpi 

$ la - 1 opl copy. of. cpl 

-rw-r--r-- l bruce bruce 37418 Jul 23 03:12 copy. of. cpl 
-rwxrwxr-x l bruce bruce 37419 Jul 23 03:08 cpl 

$ cmp cpl copy. of. cpl 

$ 


用 Unix 所 带 的 文件 比较 工具 cmp 对 上 述 丙 个 文件 的 内 容 微 比较 。 cmp 没有 给 出 任何 
提示 ,说 上 明 它 们 的 内 容 完 侈 相同。 
接 下 来 看 看 程序 对 错误 输入 的 反映 ,在 命令 行 输入 . 





$ Cpl xxx123 filel 
Error; Cannot open xxx123; No such file or directory 
$ cpl cpl /tmp 

Error; Cannot creat /tmp; Is a directory 


[3E 5 FA SE ISI FH ASK OLS Bh Bea fF s EUR RT RE EAE A Box de d i f 
沈 。 注 意 不 要 沟 盖 掉 那 些 想 要 保存 的 文件 。 


2.6.4 Unix 编程 看 起 来 好 像 很 简单 


who 命令 从 文件 中 读数 据 然后 以 一 定 的 格式 输出 ,cp 命令 从 一 个 文件 中 读数 据 然后 写 
入 到 另外 的 文件 中 ,它们 用 到 的 是 类 似 的 系统 调用 ,都 是 在 内 存 和 文件 之 间 交 换 数据 ,可 以 
从 联机 帮助 和 头 文件 中 得 到 足够 的 信息 来 进行 编程 ， 

这 样 看 来 ,Unix 编程 好 像 真 的 不 准 ,是 不 是 还 有 些 东 西 没 涉 及 到 ? SREP EH, Bic 














* 48 + Unix/Linux 编程 实践 教程 





不 记得 那 3 个 问题 ? 在 这 里 昌 多 问 一 个 问题 : 如 何 使 你 的 程序 运行 得 更 加 有 效 ? 
2.7 提高 文件 1/0 效率 的 方法 : 使 用 缓冲 
cpl 中 定义 了 BUFFERSIZE 这 个 常量 , 几 于 标识 每 次 读 / 写 操作 的 数据 长 度 , 这 里 的 值 
是 4096, 接 下 来 是 个 很 重要 的 问题 ; 缓冲 区 的 大 小 对 忻 能 有 影响 凤 ? 
2.7.1 缓冲 区 的 大 小 对 性 能 的 影响 


缓冲 区 的 天 小 对 尾 能 有 很 大 的 影响 ,举例 来 说 ,用 康子 把 汤 从 一 个 碗 里 至 到 另 一 个 蓝 
里 ,用 较 太 的 钉子 就 可 以 少 理 几 次 ,从 而 节省 时 间 ，。 
对 文件 操作 而 言 也 是 这 样 的 ,来 看 对 一 个 2500 字 节 的 文件 的 copy SE; 








文件 大 小 = 2500 学 节 
me ER app Xd. = 100 字 节 

那么 需要 25 次 read() WI 25 1k write) 
WR fésRIEX Koh = 1000 FH 

那么 需要 3 次 read(}#l 3 W write) 


把 缓冲 区 从 100 字 节 增加 到 1000 字 节 会 使 系统 调用 的 次 数 从 50 次 减少 到 6 次 ,这 确实 
很 可 观 。 
复制 一 个 5MB 大 小 的 文件 ,不 同 的 缓冲 区 所 对 应 的 执行 时 间 如 下 ;: 





38 nb X d 执行 时 间 /s 
1 30. 29 
4 12. 81 
16 3.28 
32 0, 96 
128 0, 56 
256 0. 37 
512 0, 27 
1024 0. 22 
2048 0. 18 
4096 0, 18 
8192 a. 18 


16384 9.18 
一 MÀ uL elB 7 
系统 调用 是 需要 时 间 的 ,程序 中 频繁 的 系统 调用 会 降低 程序 的 运行 效率 。 
2.7.2 为 什么 系统 调用 需要 很 多 时 间 


为 什么 系统 调用 会 消耗 很 多 时 间 ? 参见 图 2.5 所 示 的 控制 流程 。 
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图 2.5 系统 调用 时 的 控制 流 图 


图 2.5 中 用 户 进程 位 于 用 户 空间 ,内 核 位 于 系统 空间 ,磁盘 只 能 被 内 核 直接 访问 。 程序 
cpl 要 读 取 磁 盘 上 的 数据 只 能 通过 系统 调用 read, 而 read 的 代码 在 内 核 中 ,所 以 当 read 调用 
发 生 时 ,执行 权 会 从 用 户 代码 转移 到 内 核 代码 ,执行 内 核 代码 是 需要 时 间 的 。 

系统 调用 的 开销 大 不 仅仅 是 因为 要 传输 数据 , 当 运 行内 核 代码 时 ,CPU 工作 在 管理 员 
(supervisor. 又 称 超级 用 户 ) 模 式 ,这 对 应 于 一 些 特殊 的 堆栈 和 内 存 环境 ,必须 在 系统 调用 发 
生 时 建立 好 。 系 统 调用 结束 后 (read 返回 时 ) ,CPU 要 切换 到 用 户 模式 ,必须 把 堆栈 和 内 存 环 
境 恢复 成 用 户 程序 运行 时 的 状态 ,这 种 运行 环境 的 切换 要 消耗 很 多 时 间 。 

当 工 作 在 管理 员 模式 下 ,程序 可 以 直接 访问 磁盘 ,终端 .打印 机 等 设备 ,还 可 以 访问 全 部 
的 内 存 空间 ,而 在 用 户 模式 ,程序 不 能 直接 访问 设备 ,也 只 能 访问 特定 部 分 的 内 存 空间 。 在 
运行 时 刻 ,系统 会 根据 需要 不 断 地 在 两 种 模式 间 切 换 。 管理 员 模 式 和 用 户 模 式 的 切换 与 
CPU 关系 很 大 ,CPU 中 有 特定 的 标记 来 区 分 当前 的 工作 模式 ,而 Unix 系统 的 设计 必须 考虑 
到 CPU 的 这 种 特点 ,才能 够 实现 不 同 工 作 模式 间 的 良好 切换 。 

举 个 影片 超人 的 例子 , 当 肯 特 ( 生 活 中 的 超人 ) 要 从 用 户 模式 (普通 人 ) 切 换 到 管理 员 模 
起 (超人 ) 时 ,他 得 先 找 个 地 方 ,比如 电话 亭 , 脱 下 西装 , 摘 掉 眼镜 ,再 改变 发 型 , 变 成 超人 后 才 
能 去 拯救 别人 ,事情 完了 以 后 ,还 得 找 个 地 方 变 回 普通 人 。 变 来 变 去 是 需要 时 间 的 ,要 是 肯 
特 整 天 忙于 变 来 变 去 ,就 不 会 有 太 多 的 时 间 来 拯救 人 类 了 。 

在 计算 机 的 世界 中 也 是 一 样 ,要 是 CPU 把 太 多 的 时 间 消 耗 在 执行 内 核 代 码 和 模式 切换 
上 ,就 不 可 能 有 很 多 时 间 来 执行 程序 中 业务 逻辑 的 代码 或 提供 系统 服务 ,所 以 要 尽 可 能 地 减 
少 模式 间 的 切换 。 对 系统 来 说 这 种 时 间 上 的 开销 是 昂贵 的 ,那么 who 版 本 花费 在 读 、 写 数据 
的 时 间 开 销 有 多 大 呢 ? 


2.7.3 低 效率 的 who2. c 
每 次 从 utmp 中 读 出 一 条 记录 ,就 如 同 要 煎 3 个 荷包 蛋 , 每 次 到 超市 去 买 一 个 鸡蛋 ,前 好 
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了 再 去 买 一 个 ,这 是 很 低 效率 的 方法 ,完全 可 以 一 次 把 3 个 鸡蛋 都 买 回来 。 对 于 who 而 言 ， 
可 以 一 次 读 入 多 个 记录 放 在 缓冲 区 中 ,下 面 是 实现 上 述 想法 的 伪 代 码 : 


getegg() { 

if ( eggs left in carton == 0) 
refill carton at store 
if ( eggs at store == 0) 

return EndOfEggs 

} 

eggs left in carton-- ; 

return one egg; 


} 


getegg 的 每 次 调用 会 从 篮子 里 拿 一 个 鸡蛋 ,而 不 是 每 次 都 要 到 超市 去 买 ,只 有 当 篮 子 空 
了 才 需 要 去 超市 。 
参见 /usr/include/stdio. h 中 gete 的 代码 ,getc 的 实现 使 用 了 与 getegg 类 似 的 算法 。 


2.7.4 在 who2.c 中 运用 缓冲 技术 


在 who2.c 中 加 入 缓冲 机 制 可 以 提高 程序 的 运行 效率 , 接 下 来 要 把 getegg 中 的 想法 用 代 
码 实现 ,如 图 2. 6 所 示 。 


用 utmplib 来 缓冲 
main 函数 调用 utmplib. c 中 的 函数 来 取 
得 下 一 条 utmp 记录 


utmplib. c 中 定义 的 函数 每 次 从 文件 中 读 
取得 6 条 记录 放 人 数组 中 


当 数 组 中 的 6 条 记录 都 被 取 走 后 , 才 调 用 
内 核 服务 重新 读 取 数据 





图 2.6 在 用 户 空间 数据 加 入 磁盘 缓冲 


用 一 个 能 容纳 16 个 utmp 结构 的 数组 作为 缓冲 区 ,在 图 2. 6 中 标识 为 buffer, 就 像 你 一 
次 会 买 很 多 个 鸡蛋 一 样 ,buffer 可 以 存放 很 多 数据 。 编 写 utmp_next 函数 来 从 缓冲 区 中 取得 
下 一 个 utmp 结构 的 数据 。 

修改 原来 的 主 函数 main, 通 过 调用 utmp_next 来 取得 数据 , 当 缓 冲 区 的 数据 都 被 取出 
后 ,utmp_next 会 调用 read, 通 过 内 核 再 次 获得 16 条 记录 充满 缓冲 区 。 用 这 种 方法 可 以 使 
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read 的 调用 次 数 减 少 到 原来 的 1/16. 
以 上 算法 在 utmplib.c pp SES, 


¿x utmplib.c 一 functions to buffer reads from utmp file 


* 

* functions are 

* utmp opent filename } ^ Open file 

* returns - l on error 

* utmp nextí ) - return pointer to next struct 
a returns NULL on eof 

* utmp closet) — close file 

x 

* reads NRECS per read and then doles them out from the buffer 
#f 


# include — «stdio. h> 
# include = <(fcntl. ho 
# include <csys/types. h= 


# include — «utmp. h> 


# define NRECS 16 
4 define NULEUT ((struct utmp x NULL) 
4 define UTSIZE (sizeof(struct utmp)) 


static char utmpbhuf[NRECS + UTSIZE]; fs 
static int num recs; je 
static int cur rec; fx 


static int fd_utmp = - 1; fs 


H 


utmp open( char * filename ) 


i 
fd utmp = opent filename, O RDONLY ); fn 
cur rec = num recs = Q; in 
return fd utmp; fx 
} 


struct utmp x utmp nextt) 
{ 
struct utmp * recp; 
if ( fd utmp == -1) i% 
return NULLUT; 
if (cur rec == num recs && utmp reload() 2-0? /* 
return NULLUT; 


storage x*/ 
num stored +/ 
next to go x, 


read from x/ 


open it «/ 
no recs yet «/ 


report »/ 


error 7 «/ 


any more ? &/ 


/* get address of next record x/ 


recp = ( struct utmp * ) &utmpbuf[cur rec * UTSIZE]: 
cur rec t; 


return recp; 
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L 
1 


int utmp reload() 


fx 


* read next bunch of records into buffer 
x! 


! 
L 


int amt read; 


amt read = readi fd utmp , utmpbuf, NRECS * UTSITE); 


num recs - amt read/UTSIZE; 
cur rec = D; 


return num recs; 


utmp close() 


{ 
if (fd utmp |= - 13 
closet fd utmp 2; 


/* read them in x/ 
/* how many did we get? «/ 


/* reset pointer #/ 


/* don't close if not x/ 


/* open x/ 


utmplib.c 包 含 使 用 缓冲 区 所 需 的 变量 和 函数 ,变量 num. recs 记录 了 缓冲 区 中 的 数据 


个 数 ,变量 cur rec 记录 了 缓冲 区 中 局 被 使 用 的 数据 的 个 数 。 


每 次 要 从 缓冲 区 中 读数 据 前 , 先 检查 cur, rec 的 值 是 否 等 于 num recs, 如 果 相 等 说 明 组 
冲 区 中 已 经 没有 可 用 数据 了 ,就 调用 read 从 硬盘 上 读数 据 来 填 满 缓冲 区 ,在 返回 数据 前 , 增 


加 car rec 的 值 。 


BS utmp_next 返回 指向 结构 的 指针 ,utmplib. c 隐藏 广 实现 细节 ,提供 简单 清晰 的 操 


作 缓 冲 区 的 接口 。 
下 面 是 修改 后 的 main: 


/* who3.c — who with buffered reads 


* 7 surpresses empty records 
* - formats time nicely 
* - buffers input (using utmplib) 


: 


EF 
# include — «stdio. Ro» 

# include —-sys/types. h> 
# include «7 utmp. h> 

# include — «fentl.ho 


# include < Lime. h> 
# define SHOWHOST 


void show info(struct utmp # ); 


void showtime(time t); 
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int main() 
{ 
struct utmp x utbufp, /* holds pointer to next rec x/ 


x utmp next(); /* returns pointer to next x/ 


if ( utmp open( UTMP FILE ) == 一 1 ){ 
perror(UTMP FILE); 
exit(1); 
! 
while ( ( utbufp = utmp next() ) != ((struct utmp * ) NULL) ) 


show info( utbufp ); 
utmp close( ); 
return 0; 
} 
/* 
* show info() 


修改 后 的 主 函 数 没 有 直接 对 open read 和 close 进行 调用 ,而 是 调用 与 之 等 价 的 具有 组 
冲模 式 的 函数 接口 。 用 于 显示 的 函数 show_info 没有 受到 任何 影响 。 


2.8 ”内核 缓冲 技术 
应 用 缓冲 技术 对 提高 系统 的 效率 是 很 明显 的 , 它 的 主要 思想 是 一 次 读 人 大 量 的 数据 放 
入 缓冲 区 ,需要 的 时 候 从 缓冲 区 取得 数据 。 


内 核 使 用 缓冲 吗 


管理 员 模 式 和 用 户 模式 之 间 的 切换 需要 消耗 时 间 , 相 比 之 下 ,磁盘 的 L/O 操作 消耗 的 时 
间 更 多 ,为 了 提高 效率 ,内 核 也 使 用 缓冲 技术 来 提高 对 磁盘 的 访问 速度 ,如 图 2. 7 所 示 。 





内 核 缓冲 区 (位 于 系统 空间 ) 


图 2.7 内 核 缓冲 磁盘 上 的 数据 
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EA utmp 文件 是 用 户 登 录 记 录 的 集合 ,磁盘 是 数据 块 的 集合 ,内 核 会 对 磁盘 上 的 数据 
块 作 缓冲 ,就 像 who 程序 缓冲 utmp 记录 一 样 。 内 核 将 磁盘 上 的 数据 顽 复 制 到 内 核 缓 冲 区 
中 , 当 一 个 用 户 空间 中 的 进程 要 从 磁盘 上 读数 据 时 , 内 核 一 般 不 直接 读 磁 盘 , 而 是 将 内 核 组 
冲 区 中 的 数据 复制 到 进程 的 缓冲 区 中 。 

当 进 程 所 要 求 的 数据 块 不 在 内 核 缓 冲 区 时 ,内 核 会 把 相应 的 数据 块 加 入 到 清 求 数据 列 
表 中 ,然后 把 该 进程 挂 起 ,接着 为 其 他 进程 服务 。 

一 段 时 间 之 后 (很 短 ) ,内核 把 相应 的 数据 块 从 磁盘 读 到 内 核 缓冲 区 ,然后 再 把 数据 复制 
到 进程 的 缓冲 区 中 ,最 后 唤 卫 被 排 起 的 进程 。 

理解 内 核 缓 冲 技术 的 原理 有 助 于 更 好 地 掌握 系统 调用 read 和 write, read 把 数据 从 内 核 
缓冲 区 复制 到 进程 缓冲 区 ,write 把 数据 从 进程 缓冲 区 复制 到 内 核 缓冲 区 ,它们 并 相等 价 于 数 
据 在 内 尽 钥 冲 和 磁盘 之 问 的 交换 ， 

蕉 理 论 上 讲 , 内 核 可 以 在 任何 时 候 写 磁 盘 , 但 并 不 是 所 有 的 write 操作 都 会 导致 内 核 的 
号 动作 。 内 核 会 把 要 写 的 数据 暂时 存在 缓冲 区 中 ,积累 到 一 定数 量 后 表 一 次 写 和 信 。 有 时 会 
导致 意外 情况 ,比如 突然 断 电 ,内 核 还 来 不 及 把 内 核 蟹 冲 区 中 的 数据 写 到 磁盘 上 ,这 些 更 新 

应 用 内 核 缓 冲 技 术 导 致 的 结果 : 

， 提高 磁盘 1/O 效率 
* RERE HERE 
*” 需 加 及 时 地 将 缓冲 数据 号 人 磁盘 


2.9 M fF EE S 


who 其 从 文件 读数 据 ,cp 从 一 个 文件 读数 据 写 人 到 另 一 个 文件 中 ,会 不 会 有 对 同一 个 文 
件 既 读 又 写 的 情况 呢 ? 


2.9.1 注销 过 程 : 做 了 些 什 么 


在 注销 过 程 中 ,系统 改变 了 文件 utmp 中 相应 的 登录 记录 ,从 whol 的 输出 可 以 看 出 文件 
ump 中 还 包含 那些 末 被 使 用 的 终端 的 信息 ,通过 实验 来 理 这 个 过 程 : 

L 分 别 从 两 个 窗口 登录 到 一 个 Unix 系统 中 。 

2. 和 运行 前 向 编写 的 whol 程序 来 察看 ump 中 与 你 的 登录 相关 的 两 条 记录 。 注 意 用 来 

登录 的 是 哪 - -个 终端 。 

3. 注销 其 中 一个。 

4. 运行 whol 察看 上 述 两 条 记录 内 容 的 变化 。 

你 会 发 现 其 中 一 条 的 用 户 和 名 字段 距 原 来 的 不 同 , 它 的 ut, time 字段 的 值 也 发 生 了 改变。 
在 有 些 系统 中 ,用 户 名 是 被 清空 的 。 还 请 关心 该 记录 还 有 哪些 改变 ?如 果 是 远程 登录 昵 ? 


2.9.2 注销 过 程 : 如 人 工作 的 
这 其 实 很 简单 .要 把 用 户 名 清空 , 按 以 下 步骤 做 就 行 了 ， 
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1. SI7F Xt utmp; 
2. 从 ump 中 找到 包含 你 所 在 终端 的 登录 记录 ; 
3. 对 当前 记录 做 修改 ; 
， 4. 关闭 文件 ， 
下 面 详细 讨论 这 4 个 步骤 。 
1， 打 开 文 件 utmp 
因为 负责 注销 的 程序 必须 对 文件 utmp 进行 读 ( 找 到 登录 记录 } 利 写 ( 修 改 登 录 记 录 ) 操 
作 , 有 所 以 必须 先 打 开 这 个 文件 : i 


fd = open(UTMP FILE, O_RDWR); 


2. 从 utmp 中 找到 包 合 你 所 在 终端 的 登录 记录 
这 一 步 很 简单 ,在 while 循环 中 读 取 一 条 utmp 记录 ,将 它 的 ut_line 字段 跟 你 的 终端 的 
名 字 司 比较 ;如 果 相 等 则 调用 修改 函数 : 


while ( read(fd, rec, utmplen) == utmplen) /* get next record x/ 
if ( stromp(rec.ut line, myline) == 0) /* what, my line? #/ 
revise entry(); /* remove my name x/ 


3. 对 当前 记录 做 修改 

负责 注销 的 程序 修改 当前 记录 ,再 把 它 写 回 到 文件 ump 中 。 基体 来 说 ,要 把 ut_type 
的 值 从 USER, PROCESS 改 成 DEAD PROCESS, ,把 ut time 字段 的 值 改 为 注销 时 间 ,也 就 
是 当前 时 间 , 有 些 版 本 会 把 用 户 名 和 远程 主机 字段 的 内 容 清 空 , 这 些 代 码 编 写 起 来 很 
容易 。 

接 下 来 要 处 理 一 个 款 手 的 问题 ,如 何 把 修改 过 的 记录 写 回 文件 ? 可 以 用 write 吗 ? 不 
行 ,write 只 会 更 新 下 一 条 记录 ,而 不 是 当前 那 条 要 修改 的 记录 。 因 为 系统 每 次 打开 一 个 文件 
都 会 保存 ~ 个 指向 文件 当前 位 置 的 指针 , 当 读 写 操 作 完 成 时 ,指针 会 移 到 下 一 个 记录 位 置 ， 
这 个 指针 与 文件 描述 符 相 关联 。 在 这 种 情况 下 ,指针 是 指向 下 一 条 登录 记录 的 头 一 个 字 节 ， 
这 引出 了 一 个 重要 的 问题 ， 

问题 : 在 文件 操作 中 ,如 何 改 变 一 个 文件 的 当前 读 / 写 位 置 ? 

答题 使 用 系统 调用 lseek。 

4. 关闭 文件 

调用 close(fd), 


2.9.3 改变 文件 的 当前 位 置 


前 面 讲 过 Unix 每 次 打开 一 个 文件 都 会 保存 一 个 指针 来 记录 文件 的 当前 位 置 , 如 图 2.8 
BRAS. 
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read 从 当前 位 置 读 人 指 
定 长 度 的 数据 ,然后 移动 
当前 位 置 指针 ,指向 下 一 
个 未 读 的 数据 


文件 开始 位 置 





文件 当前 位 置 


图 2.8 内 核 为 每 个 打开 的 文件 保存 一 个 位 置 指针 


当 从 文件 读数 据 时 ， 内 核 从 指针 所 标明 的 地 方 开 始 , 读 取 指 定 的 字 节 ,然后 移动 位 置 指 
针 , 指 向 下 一 个 未 被 读 取 的 字 节 , 写 文 件 的 操作 也 是 类 似 的 。 

指针 是 与 文件 描述 符 相 关联 的 ,而 不 是 与 文件 关联 ,所 以 如 果 两 个 程序 同时 打开 一 个 文 
件 ,这 时 会 有 两 个 指针 ,两 个 程序 对 文件 的 读 操作 不 会 互相 干扰 。 

系统 调用 lseek 可 以 改变 已 打开 文件 的 当前 位 置 ,1seek 的 用 法 如 下 : 





Iseek 
人 

目标 使 指针 指向 文件 中 的 指定 位 置 
头 文件 # include <sys/type, h> 

# include <unistd. h> 
函数 原型 off t oldpos = Iseek(int fd, off t dist, int base) 
参数 fd 文件 描述 符 

dist 移动 的 距离 


base SEEK SET => 文件 的 开始 
SEEK_CUR 一 > 当前 位 置 


SEEK END => 文件 结尾 
3 P 
返回 值 mä BSRR 
oldpos 指针 变化 前 的 位 置 
一 一 


lseek 改变 文件 描述 符 所 关联 的 指针 的 位 置 ,新 的 位 置 由 dist 和 base 来 指定 ,base 是 基 
准 位 置 ,dist 是 从 基准 位 置 开始 的 偏 移 量 。 基准 位 置 可 以 是 文件 的 开始 (0) 、 当 前 位 置 (1) 或 
文件 的 结尾 (2)。 如 : 


lseek(fd, — (sizeof(struct utmp)), SEEK CUR); 


把 指针 往 前 移 一 个 utmp 结构 ,注意 偏 移 量 可 以 是 负 的。 


lseek(fd, 10 * sizeof(struct utmp), SEEK SET); 


上 述 代码 把 指针 指 到 第 11 个 记录 的 开始 位 置 。 下 面 的 代码 ， 


lseek(fd, 0, SEEK END); 
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write(fd, "hello", strleni("hello")); 


使 指针 指 到 文件 的 末尾 , 接 下 来 写 一 个 字符 串 到 文件 中 。 
最 后 要 说 明 的 是 ,lseek(fd, 0, SEEK. _ CUR) RABE PLE IS I SHEE. 


2.9.4 编写 终端 注销 的 代码 
利用 上 述 知 识 就 可 以 编写 一 个 娩 数 对 注销 的 的 用 户 修 改 utmp 中 柑 应 的 记录 : 


* logout tty(char # line) 

* marks a utmp record as logged out 

* does not blank username or remate host 
* return — l on error, 0 on success 

xf 
int logout_tty(char * line) 
{ 


int fd; 

struct utmp rec; 

int len = sizeof( struct utmp) - 

int retval = -1; /* pessimism */ 

if (6 fd = open(UTMP PILE,O RDWR)) == -1) /* open file #/ 
return - 1; 


/* gearch and replace */ 


while (read(fd, &rec, len} == len) 
if (strnemp(rec.ut line, line, sizeof(rec.ut line)) == 0) 
{ 
rec.ut type = DEAD PROCESS; /* set type «/ 
if (time(&rec.uL time l= -1)) /* and time «/ 
if ( lseek(fd, - len, SEEK CUR)! -—1) /x back up «/ 
if (write(fd, &rec, len) == len) /* update x/ 
retval - 0; /* success! x/ 
break; 


} 
/* close the file «/ 
if (close(fd) == - 10D 
retval = -1; 
return retval; 


} 


上 述 这 段 代码 对 每 个 系统 调用 都 有 出 错 处 理 ,这 是 很 有 必要 的 ,因为 这 个 程序 需要 修改 
一 些 重要 的 系统 配置 文件 ,如 果 这 些 文 件 的 内 容 遭 到 破坏 , 那 系统 就 会 遇 到 麻烦 。 实 际 上 ， 
这 本 书 中 不 是 所 有 的 地 方才 有 很 完善 的 出 错 处 理 , 这 并 不 表示 出 错 处理 不 重要 ,而 是 为 了 使 
程序 更 加 清晰 易 懂 。 
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接 下 来 看 看 出 错 处 理 与 报告 。 


2.10 ”处 理 系统 调用 中 的 错误 


如 果 open 无 法 打开 指定 的 文件 , 它 会 返回 一 1。 同 样 地 , 当 read 无 法 读 的 时 候 , 它 会 返 
回 一 1, 当 lesk 无 法 指定 指针 位 置 时 , 它 也 会 返回 一 1, 一 1 是 表示 在 系统 调用 中 出 了 些 问题 ， 
调用 者 每 次 都 必须 检查 返回 值 ,一 旦 检测 到 错误 ,必须 做 出 相应 的 处 理 。 

系统 调用 会 遇 到 哪些 错误 呢 ? 每 个 系统 调用 都 有 自己 的 错误 集 ,以 open 为 例 , 如 果 要 打 
开 的 文件 不 存在 ,或 者 虽然 存在 ,但 没有 读 的 权限 ,或 者 已 经 打开 的 文件 太 多 ,都 会 导致 系统 
报错 。 如 何 来 确定 发 生 了 哪 一 种 错误 呢 ? 

1. 确定 错误 的 种 类 : errno 

内 核 通过 全 局 变量 errno 米 指明 错误 的 英 型 ,每 个 程序 都 可 以 访问 到 这 个 变量 。 

在 srror(3) 的 联机 帮助 和 <-ertno. h 盖 中 包含 错误 代码 和 相应 的 说 明 ,以 下 是 一 些 例子 ， 





F define  EPERM 
# define  ENOENT 


/* Operation not permitted #/ 


/* No such file or directory «/ 


#define EINTR 
Hdefine EIQ 


1 
2 
# define ESRCH 3  /* No such process +’ 
4  /* Interrupted system call «/ 
5 


/* I/0 error x/ 


2. 不 同 的 错误 需要 不 同 的 处 理 
根据 以 上 放出 的 错误 次 型 ,在 程序 中 进行 相 虚 的 处 理 : 


# include < errno, h> 
extern int errno; 

int sample(} 

{ 


int fd; 
fd = open("file", O RDONLY); 
if (fd == -1) 


{ 
printf("Cannot open file. "); 
if ( errno == ENDENT ) 
pritnf("There is no such file. "}; 
else if ( errno == EINTR } 
printf( "interrupted while opening file, ">; 
else if ( errno == EACCESS } 


printf "You do not have permission to open file. "); 


需要 根据 不 同 的 错误 类 型 做 不 同 的 错误 处 理 。 hn RELATA MU PER ETE BO HR 
示 重 新 输 人 文件 名 ,如 果 已 经 打开 的 文件 太 多 , 那 就 关闭 一 些 不 需要 的 文件 ,这 种 情况 是 不 
需要 给 用 户 任何 提示 的 ， 
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3. 显示 错误 信息 : perror(C3) 

在 需要 显示 出 错误 信息 的 时 候 ,可 以 根据 不 同 的 错误 代码 打印 相应 的 字符 串 , 上 面 的 例 
了 sample() 就 是 这 样 做 的 ,另外 一 种 更 简便 的 方法 是 用 perror(string) XP MR. ESAS 
查找 错误 代码 ,在 标准 错误 输出 中 显示 出 相应 的 错误 信息 ,参数 string 是 要 同时 显示 出 的 措 
述 性 信息 ， 

应 用 了 perror 的 sample; 


int sample() 


1 


int fd; 
fd = open("file", O RDONLY); 
if (fd == - 1) 


1 
perrori "Cannot open file"; 
return; 


} 


当 有 错误 发 生 时 ,可 能 会 看 到 如 下 的 信息 : 


Cannot open file; No such file or directory 
Cannot open file: Interrupted system call 


显示 的 第 一 部 分 是 用 户 传递 进去 的 描述 性 信息 ,第 二 部 分 是 根据 错误 代码 查 到 的 错误 


小 结 


1l. 主要 内 容 
who 命令 通过 读 系 统 日 志 的 内 容 显 示 当 前 已 经 登录 的 用 户 。 
Unix 系统 把 数据 存放 在 文件 中 ,可 以 通过 以 下 系统 调用 操作 文件 ， 


open(filename, how) 


* 


creat(filename, mode} 

read(fd, buffer, amt) 

write(fd, buffer, amt} 

lseek(fd, distance, base) 

close(fd) 
JEBUS C PE AY E SBE SOCIETE VE OR OR CERT MERE ZA IL BO E E. 
每 次 系统 调用 都 会 导致 用 户 模式 和 内 核 模式 的 切换 以 及 执行 内 核 代码 ,所以 减少 程 
序 中 的 系统 调用 发 生 的 次 数 可 以 提高 程序 的 运行 效率 。 
程序 可 以 通过 缓冲 技术 来 碱 少 系统 调用 的 次 数 , 仅 当 写 缓冲 区 满 或 读 缓冲 区 空 时 才 
调用 内 核 服务 ， 
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Unix 内 核 可 以 通过 内 核 缓冲 来 减少 访问 磁盘 L/O 的 次 数 。 
Unix 中 时 间 的 处 理 方 式 是 记录 从 基 一 个 时 间 开 始 经 过 的 秒 数 。 
当 系统 调用 出 错时 会 把 全 局 变量 errno 的 值 设 为 相应 的 错误 代码 ,然后 返回 一 1, 程 


序 可 以 通过 检查 errno 来 确定 错误 的 类 型 ,并 采取 相应 的 措施 。 


这 一 章 涉及 的 知识 在 系统 中 都 可 以 找到 ,联机 帮助 中 有 命令 的 说 明 , 有 些 还 会 涉及 命 





令 的 实现 , 头 文件 中 有 结构 和 系统 常量 的 定义 ,还 有 函数 原型 的 说 明 。 
à, 习题 


2.1 


2.2 


2.6 


在 Unix 中 有 一 个 到 命令 ,这 个 命令 与 who 有 关 , 运 行 这 个 命令 ,并 阅读 它 的 联机 
帮助 , 找 出 它 提供 了 哪些 who 没有 提供 的 信息 ? 其 中 有 了 哪些 信息 来 自 utmp 这 个 
文件 ? 这 些 信息 各 是 什么 含义 ?其 他 信息 来 自 哪 里 ? 


用 户 登 录 的 时 候 , 登 录 信 息 会 被 记录 在 utmp 文件 中 ,在 注销 的 时 候 ,文件 中 相应 
的 记录 会 被 删除 。 如 上 类 用 户 正 在 使 用 系统 的 时 候 , 系 统 突然 崩 演 ,很 明显 ,这 时 候 
utmp 文件 的 内 容 会 有 问题 ,在 系统 重新 启动 的 时 候 , 会 对 utmp 做 什么 处 理 呢 ? 
系统 会 不 会 重新 为 每 一 条 可 用 终端 建立 记录 ? 查阅 相关 的 联机 帮助 和 头 文件 ,以 
及 启动 脚本 , 米 找 出 上 述 问 题 的 答案 ,可 以 在 自己 的 机 器 .上 做 实验 来 验证 自己 的 








做 个 实验 ,把 一 个 文件 复制 到 /dev/tty: epl cpl. c /devytty。 这 时 复制 的 日 称 文 
件 是 一 个 终端 。 对 终端 的 读 写 操作 与 对 一 个 普 遵 文件 进行 读 写 是 一 样 的 。 接 下 
来 做 实验 ,从 终端 读 , 这 时 会 从 键盘 读 字 符 , 然 后 写 人 到 文件 中 ,输入 是 以 回 车 十 
二 Cirl-DD 汗 作为 结束 标志 的 ， 


标准 C 函数 如 fopen gete, fclose, fgets 的 实现 都 包含 内 核 级 的 缓冲 .它们 用 到 了 
一 个 结构 FILE ,并 以 此 为 基础 构造 了 类 似 utmplib 的 中 间 层 ,在 头 文件 中 找到 结 
Hj FILE 的 成 员 措 述 ,将 其 与 utmplib.c 中 的 变量 做 比较 。 


择 么 来 确定 数据 已 经 被 写 到 磁盘 上 (不 是 被 缓冲 )” 采用 组 冲 技 术 时 ,内 核 会 把 要 
写 人 磁盘 的 数据 放 在 缓冲 区 ,然后 在 它 认 为 合适 的 时 候 写 人 磁盘 。 阅 读 相 应 的 联 
机 帮助 ,找到 能 够 确定 地 把 数据 写 人 磁盘 的 方法 ， 


Unix 允许 一 个 文件 间 时 被 多 个 进程 打开 ,也 允许 一 个 进程 同时 打开 好 几 个 文件 ， 
做 多 次 打开 文件 的 实验 : 

C1) 以 读 的 方式 打开 文件 

(2) 以 写 的 方式 打开 文件 

(3) 再 次 以 读 的 方式 打开 文件 

这 时 有 3 个 文件 描述 符 , 接 下 来 : 

(4) 从 第 一 个 文件 描述 符 ( 以 下 简称 fd) p ik 20 字 节 ,显示 读 到 的 内 容 。 

(D MELA id F A" testing 12327, 

(6) Az id 读 出 20 FW. gon ie SUR PA. 
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2. T 


2. 10 


2.12 


2. 14 


2. 15 


联机 帮助 man 中 可 以 查 到 关于 命令 .系统 调用 .系统 设备 等 帮助 信息 ,如 和 何 才能 了 
解 man 的 使 用 方法 ? 在 你 的 系统 中 ,man 分 为 几 个 小 节 ? 它们 分 别 是 什么 ? 


本 章 提 到 文件 ump 中 还 包含 了 一 些 记录 ,它们 与 已 登录 用 户 的 信息 无 关 , 那 么 它 
们 看 放 的 是 什么 ” 各 代表 什么 会 闵 ? 


lseek 可 以 将 文件 指针 称 动 文件 的 末尾 以 后 ,如 : 

lseek(fd, 100, SEEK END) 

将 指针 移 到 文件 末尾 再 往 后 100 个 字 节 的 地 方 。 如 打从 文件 末尾 以 后 100 个 字 节 
的 地 方 开 始 读 会 呈现 什么 情况 ?如 果 从 文件 末尾 以 后 100 个 字 节 的 地 方 开始 写 会 
出 现 什 么 情况 ?从 100 字 节 增加 到 20000 字 季 ,再 写 人 “hello” 看 看 会 有 什么 结果 ， 
Fl ls -1 来 检查 文件 的 长 度 , 志 用 ls -s 斌 试 。 


.编程 练习 


从 who 的 联机 帮助 中 可 以 知道 who am i 也 是 可 以 接受 的 形式 ,同样 还 有 
whoami, fiit who2. c, fie X Sg who am i 的 形式 。 Bi whoami 的 联机 帮助 ,看 
它 与 who 有 什么 不 同 ,编程 实现 whoami。 


使 用 标准 cp 命令 时 , 当 原 文件 和 目标 文件 相同 时 ,会 有 什么 结果 ? 修改 who2. c 
使 之 能 够 处 理 这 种 情况 。 


在 utmplib. c 中 的 几 个 函数 是 为 了 提高 utmp 文件 的 读 写 效率 ,调用 这 些 函 数 ,每 
次 返回 一 个 utmp 记录 ,有 时 返回 的 记录 中 可 能 不 包 会 任何 有 用 的 信息 ;修改 
utmplib, c* 使 每 次 返回 的 郁 是 有 用 的 信息 。 这 样 做 会 影响 到 who3. c 其 他 部 分 
的 代码 吗 ? 为 什么 ? 


函数 logout tty Off Iseek 往 前 移动 指针 ,以 便 重 写 当前 记录 ,注意 在 这 个 函数 
中 没有 内 到 绥 溃 技术 ,如 果 使 用 缓冲 可 以 提高 程序 的 运行 效率 。 

(1) E logout tty Orp AAS] utmplib. c 中 的 函数 会 产生 什么 问题 ? 

(2) 在 utmplib. c 中 增加 一 个 函数 : 


utmp seek(record offset, base) 
改变 当前 指针 的 位 置 , record _offset E 9E E zh 89 (i XE Sb. base 可 以 是 SEEK 
SET CEEK_CUR 或 SEEK_FND, 注 意 偏 移 量 每 增加 1, 表示 要 移动 sizeof 
(struct utmp) AY Se d, 


(3) 修改 logout, tty OLURE BE We iY utmplib. c Pag gg fr. 


whol 可 以 显示 出 utmp 中 的 每 条 记录 ,虽然 这 不 是 诛 来 想 要 的 功能 ,但 却 提供 了 
一 个 工具 ,以 使 能 够 检查 utmp 文件 内 容 的 变化 。utmp 记录 中 的 at type 字段 很 
有 用 ,修改 whol 使 之 能 够 显示 utmp 记录 的 所 有 字段 ,进一步 修改 使 whol 能 够 
通过 参数 指定 要 读 取 的 文件 ,这 样 就 可 以 用 whol 来 检查 文件 wimp HAR. 


标准 的 cp 会 自动 覆盖 已 经 存在 的 文件 ,而 不 给 出 任何 提示 ,如 已 经 存在 了 一 个 文 
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ft file2, 又 输入: 

5 cp filel filez 
fu file2 的 内 容 。 标 准 的 cp 有 一 个 参数 -i 可 以 在 覆盖 前 给 出 提示 ,得 到 确认 
后 才 覆 盖 ， 修 改 cpl.c 使 之 也 具有 上 述 特性 。 


i AE 

根据 本 章 所 学 的 内 容 ,编写 以 下 的 Unix 程序 ， 

ac, last, cat, head, Lail, od, dd 

9. 最 后 一 个 问题 : tail 命令 

这 一 章 通 过 分 析 几 个 命令 已 经 学 到 了 很 多 知识 ,最 后 还 有 一 个 命令 vell 请 读者 来 分 析 。， 

Iseek 命令 可 以 移动 指针 ,lseek(fd, 0, SEEK_END) 可 以 使 指针 移 到 文件 的 末尾 ， 

tail 命令 显示 出 文件 末尾 指定 行 数 的 内 容 ,所 以 ,tail 必须 能 够 找到 文件 中 一 个 指定 的 中 
方 , 注 意 不 是 末尾 ， l 

这 如 何 来 实现 呢 ? 开动 脑筋 好 好 想 想 , 注意 用 缓冲 技术 来 提高 获 率 。 阅 读 联机 帮助 看 
看 tail BA BLE MME NRA. 

本 书 的 网 站 上 有 两 个 版 本 的 tail 的 源 代码 ,其 中 一 个 是 GNU 版 本 的 ,另外 一 个 是 BSD 
版 本 的 ,它们 用 了 完全 不 同 的 思路 , 却 都 实 碧 得 很 好 ,最 好 先 自己 写 , 然 后 再 参考 它们 的 实现 ， 
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概念 与 技巧 

。 目录 是 文件 的 列表 

。 如 何 读 取 目 录 的 内 容 

。 文件 类 型 以 及 如 何 知 道 文件 的 类 型 
。 文件 属性 以 及 如 何 知 道 文 件 的 属性 
* 位 操作 及 掩 码 的 使 用 

* 用 户 与 组 ID 及 passwd 数据 库 
相关 系统 调用 与 函数 

* opendir,readdir,closedir,seekdir 
* stat 

* chmod, chown,utime 

* rename 

相关 命令 


* Is 


$1 外 2 


已 经 介绍 了 如 何 读 / 写 文件 内 容 的 方法 。 除 了 内 容 之 外 ,文件 还 有 很 多 属性 ,比如 文件 
所 有 者 、 最 后 修改 时 间 ,文件 大 小 .类 型 等 。 文 件 名 在 目录 中 列 出 ,正如 电话 号 码 短 中 列 有 人 
名 一 样 。 如 何 读 取 文 件 名 和 文件 的 属性 呢 ? 

ls 命令 可 以 列 出 目录 中 所 有 文件 的 名 字 , 以 及 这 些 文件 的 其 他 信息 。 本 章 通过 分 析 ls 
命令 来 学 习 目 录 和 文件 的 类 型 与 属性 。 


3.2 问题 1: ls 命令 能 做 什么 


3.2.1 Is 可 以 列 出 文件 名 和 文件 的 属性 
在 命令 行 输入 Is: 
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$ ls 
Makefile docs  ls2.c s.tar statdemo.c taill.c 
chapo03 lsl.c old src  stati.c taill 
$ 


ls 的 默认 动作 是 找 出 当前 目录 中 所 有 文件 的 文件 名 RE RSA. BE ICA IS 
ls 默认 会 分 栏 输出 ,有 些 需 要 参数 C 才 这 样 做 。 
ls 还 能 显示 其 他 的 信息 ,如 果 加 上 -1 选项 ,ls 会 列 出 每 个 文件 的 详细 信息 ,也 叫 ls 的 长 


格式 : 
$ ig -1 
total 104 
-rw-rw-r-— 2 bruce users 345 Jul 29 11:05 Makefile 
-rw-rw-r-— 1 bruce users 27521 Aug 1 12:14 chap03 
drwxrwxr-x 2 bruce users 1024 Aug 1 12:15 docs 
-rw-r--r-- l bruce users 723 Feb 8 1998 lsl.c 
-rw-r--r-— 1 bruce users 3045 Feb 15 03.51 1ls2.c 
drwxrwxr-x 2 bruce users 1024 Aug 1 12;14 old src 
-rw-xw-r-- 1 bruce users 30720 Aug 1 12:05 s.tar 
-rw-r--r-- 1 bruce support 946 Feb 18 17:15 statl.c 
-rw-r--r-- 1 bruce support 191 Feb 9 1998 statdemo.c 
-rwxrwxr-x 1 ‘bruce users 37351 Bug 1 12:13 taill 
-rw-r-—r-- 1 bruce users 1416 Aug 1 12:05 taili.c 
$ 


每 一 行 代表 一 个 文件 和 它 的 多 个 





m TE. 


3.2.2 列 出 指定 目录 或 文件 的 信息 


一 个 Unix 系统 中 会 有 很 多 的 目录 ,每 个 目录 中 又 会 有 很 多 文件 。 如 果 要 列 出 一 个 
非 当 前月 录 的 内 容 或 者 是 一 个 特定 文件 的 信息 , 则 需要 在 参数 中 给 出 目录 名 或 文件 名 。 


Fi ls WEARS n REC E 














fi Y 说 8H 
ls /tmp 列 出 /tmp 目录 中 各 文件 的 文件 名 
Is +1 docs Fl docs 目录 中 各 文件 的 属性 
is -1.. /Makefile aba ed. .7 Makefile 的 属性 
ls *.c 显示 与 * ,ce 匹配 的 文件 


如 果 和 参数 是 目录 ,is 列 出 此 录 的 内 容 , 如 果 参 数 是 文件 ,ls 列 出 文件 名 和 属性 。 所 给 的 命 


令 行 选项 在 很 大 程度 上 决定 了 1s 的 输出 内 容 。 
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3.2.35 经 常用 到 的 命令 行 选项 


& 令 说 OR 








ls -a 列 出 的 内 容 包 含 以 “. UE ERO (E 
ls - lu 显 东 最 后 访问 时 间 

ls -s 显示 以 块 为 单位 的 文件 天 小 

ls -t 输出 时 按时 间 排 序 

ls -F 显示 文件 类 





如 果 对 Unix 不 是 很 熟悉 ,那么 可 能 需要 解释 一 下 -a 这 个 选项 ,在 Unix 中 ,ls 一 般 不 会 
列 出 以 "开始 的 文件 ,所 以 可 以 把 这 样 的 文件 看 作 是 隐藏 文件 。ls 加 上 了 -a 以 后 , 遇 到 这 
样 的 文件 也 必须 把 它 列 出 来 。 对 操作 系统 (例如 内 核 ) 而 言 ,文件 名 前 面 的 “. "没有 任何 特殊 
We. ERX ls 的 使 用 者 有 意义 。 

某 些 应 用 程序 的 配属 文件 是 位 于 用 户 的 主 目录 下 以 “. ”开始 的 某 个 文件 ,这 是 由 习惯 形 


成 的 ,因为 在 大 多 数 情况 下 可 以 将 它们 隐藏 。 但 是 需要 时 可 以 直接 被 打开 编辑 ,不 需要 任何 
特殊 的 操作 . 


3.2.4 问题 1 的 答案 


通过 实验 和 联机 帮助 可 以 知道 ls 做 了 以 下 两 件 事 ， 

*。 列 出 目录 的 内 容 

”显示 文件 的 信息 

注意 ls 对 文件 和 日 录 所 做 的 操作 是 不 向 的 。1s 能 判定 参数 指定 的 是 文件 还 是 目录 。 这 
FEY MAA? 如 果 要 自己 写 一 个 1s, 以 下 三 点 是 需要 掌握 的 ， 

* TAHA RMA 

- 如 何 读 取 并 显示 文件 的 属性 

， 给 出 一 个 名 字 ,如 何 能 够 判断 出 它 是 目录 还 是 文件 


3.3 vx 件 B 


在 开始 之 前 , 先 来 看 看 Unix 是 如 何 组 织 磁盘 上 的 文件 的 。 
磁 租 上 的 文件 和 目录 被 组 成 一 棵 虽 录 树 ,每 个 节点 都 是 目录 或 文件 ,如 图 3. 1 所 未 。 








文件 
图 3.1 HRR 
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图 3. 1 中 的 大 方 框 表示 目录 ,大 方 框 内 的 小 方 框 类 示 文 件 , 目 录 之 间 的 连 线 表示 月 呆 之 


间 的 组 织 关 系 。 
在 Unix 系统 中 ,每 个 文件 都 位 于 其 个 目录 中 ,在 韶 辑 上 是 没有 怠 动 器 或 卷 的 ,当然 在 物 


理 上 一 个 系统 可 以 有 多 个 驱动 器 或 分 区 ,每 个 驱动 器 上 都 可 以 有 分 区 ,位 于 不 同 驱动 器 和 分 
区 上 的 目录 通过 文件 树 无 锋 地 连接 在 一 起 ,甚至 软盘 .光盘 这 些 移动 存储 介质 也 被 挂 到 文件 


树 的 某 一 个 子 目 录 来 处 理 。 
这 些 使 1s 的 实现 极为 简单 ,只 需 考 虑 文件 和 目录 两 种 情况 ,是 无 需 考虑 驱动 器 或 分 区 。 
3.4 问题 2: ls 是 如 何 工作 的 


ls 产生 一 个 文件 名 的 列表 , 它 大 致 是 这 样 工作 的 ， 











open directory 


+--> read entry - end of dir? -+ 


. display file info 
close directory < 一 一 一 -一 -~ 一 一 * 
ERR who 的 十 分 相似 ,主要 的 区 别 是 who 从 文件 中 读数 据 , 而 ls 从 目录 中 读数 
据 , 读 目录 与 读 文 件 区 别 大 吗 ? 目录 到 底 是 什么 呢 ? 


3.4.1 什么 是 目录 
先 来 看 一 看 什么 是 目录 。 上 和 目录 是 一 种 特殊 的 文件 , 它 的 内 容 是 文件 和 目录 的 和 名字 。 从 
某 种 程度 上 说 ,目录 文件 与 上 一 章 讲 的 ump 文件 很 类 似 。 它 们 都 包含 很 多 记录 ,每 个 记录 


的 格式 由 统一 的 标准 定义 。 每 条 沁 录 的 内 容 代表 一 个 文件 或 月 录 。 
与 普通 文件 不 同 的 是 ,目录 文件 永远 不 会 空 ,每 个 日 录 才 至 少 包 含 两 个 特 跌 的 项 -一 








3.4.2 AALA open.read 和 close 来 操作 目录 





通过 以 下 实验 来 看 日 录 文 件 的 内 容 ， 


$ cat / 
88'.a'asa. . A'bw. tagsbrc| 
quota. userc!| 
quota.group'esbetce! 'sbtmp' "sbdev" sbmnt ' wcsbin '2 
sbopt2 
H 
SbusrB 
19 
sbvarð 


(many lines of bard- to- read data omitted) 


$ more /tmp 
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/tmp is a directory 


$ od -c /dev 
0000000 360 001 X0 X0 024 XO 001 XO NO XO X0 360 001 XO DO 
0000020 001 200 X0 X0 002 XO XO XO 024 X0 002 XO . . Yo X0 


0000040 002 X0 \O X0 001 200 X0 0 361 001 XO X0 030 XO Xa 0 
0000060 HM A K E D E V XQ 361 001 XO XD 001 200 XO y0 
0000100 362 001 XO 0 030 X0 004 XO k 1 o g \O XO XO Và 
0000120 362 001 X0 X0 001 200 XO X0 363 001 XO X0 030 XO 004 %0 
0000140 Ke o m X0 XO XO XO 363 001 XO X0 00i 200 YO 0 
0000160 364 001 X0 X0 030 NO Ya kk b i n 1 o g “0 
0000200 364 001 X0 0 001 200 X0 X0 365 001 XO X0 030 X0 004 40 
0000220 k m e m X0 XO XO X0 365 001 XO XO 001 200 AO VO 
0000240 366 001 X0 X0 024 X0 003 XO m e m \0 346001 XO AO 





从 以 上 的 例子 中 可 以 发 现 3 点 ,第 一 ,cat I od 可 以 打开 目录 。 因 为 cat 和 od 使 用 的 是 
标准 的 文件 操作 系统 调用 ,所 以 目录 可 以 被 open. read close 打开 ;第 二 ;more RT A RAH 
件 和 只 录 , 它 拒绝 对 目录 进行 操作 ,有 些 版 本 的 cat 和 more — ETE A Sos EE PAL BHM 
以 上 列 出 的 目录 内 容 可 以 知道 ,目录 内 不 是 无 格式 的 文本 而 是 包含 一 定 的 数据 结构 。 

实际 上 用 open ,read close 这 些 系统 调用 来 操作 已 录 并 不 是 很 好 的 方法 ,Unix 支持 多 种 
的 目录 类 型 ,有 Apple HFS.1809660, VFAT NFS 等 ,如 果 用 read 来 读 , 那 么 需要 了 解 这 些 
不 同类 型 月 录 各 自 的 结构 细节 。 


3.4.3 如 何 读 有 目录 的 内 容 
fF. RCT DLE SRE? 在 联机 帮助 中 根据 关键 字 direct KERER.: 


5 man - k direct 


我 所 用 的 系统 返回 了 81 条 主题 ,用 grep 滤 出 那些 包含 read HER: 





$ man -k direct grep read 
DxmHelpSystemDisplay (3X) - Displays a topic or directory of the help file in Bookreader. 
opendir, readdir, readdir r, telldir, seekdir, rewinddir, closedir(3) — Performs operations 


on directories 


S D] 
其 中 的 readdir EEG EM. KBE MALS BU. 


5 man 3 readdir 


opendir(3) opendir(3) 


NAME 


opendir, readdir, readdir r, telldir, seckdir, rewinddir, closedir 一 


Performs operations on directories 
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LIBRRRY 


Standard C Library (libc.a) 
SYNOPSIS 


# include — sys/types. h> 
# include <dirent. h> 


DIR * opendir(const char * dir name); 

struct dirent * readdir(DIR x dir pointer); 

int readdir r(DIR * dir pointer, struct dirent * entry, 
struct dirent ** result); 

long telldir(DIR * dir pointer); 

void seekdir(DIR * dir pointer, long location ); 

void rewinddir(DIR * dir pointer); 

int closedir(DIR * dir pointer); 

[more] (11% ) 


通过 联机 帮助 可 以 知道 ,从 目录 读数 据 与 从 文件 读数 据 是 类 似 的 ,opendir 打开 一 个 目 
录 ,readdir 返回 目录 中 的 当前 项 ,closedir 关闭 一 个 目 录 , seekdir、telldir、rewinddir 与 lseek 
的 功能 类 似 , 如 图 3.2 所 示 。 


struct dirent 





opendir(char * ) 
creates a connection, 
returns a DIR * 


readdir (DIR * ) 
reads next records, 
returns a pointer 
to a struct dirent 


closedir (DIR * ) 
closes a connection 


H3.2 从 目录 中 读 到 一 项 


目录 是 文件 的 列表 ,更 确切 地 说 ,是 记录 的 序列 ,每 条 记录 对 应 一 个 文件 或 子 目 录 。 通 
过 readdir 来 读 取 目 录 中 的 记录 ,readdir 返回 一 个 指向 目录 的 当前 记录 的 指针 ,记录 的 类 型 
是 struct dirent, 这 个 结构 定义 在 /usr/include/dirent. h 中 ,联机 帮助 中 也 可 以 查 到 。 

在 SunOS 中 关于 它 的 帮助 信息 如 下 : 


File Formats dirent(4) 


NAME 


dirent - file system independent directory entry 
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SYNOPSIS 
# include «dirent. h> 


DESCRIPTION 
Different file system types may have different directory entries. The dirent structure 
defines a file system independent directory entry, which contains information common to 
directory entries in different file system types. A set of these structures is returned by 


the getdents(2) system call. 
The dirent structure is def ined. 


struct dirent | 


ino t d ino; 

off t d off; 
unsigned short d reclen; 
char d nane(1]0D, 


}; 


dirent 结构 中 成 员 d. name 用 于 存放 文件 名 。 广 意 在 此 系统 中 d nme RE NLWRA 
个 元 罕 的 数组 ,这 如 何 能 做 到 呢 ? 因 为 一 个 字符 的 空间 只 能 存放 字符 串 的 结束 符 。 


3.5 问题 3: 如 何 编写 Is 


ls 的 算法 如 下 : 


main() 
opendir 
while ( readdir ) 
print d name 


closedir 


SE SE I E F : 


fee isic 
** purpose list contents of directory or directories 
** action if no args, use. else list files in args 
xx 

# include <stdio, h> 

# include < sys/types. h> 

# include «dirent. h> 


void do ls(char [D ; 


main(int ac, char » av[ ]) 








T ÆRE: 关于 d name 的 定义 ,UNIX 的 各 个 版 本 稍 有 不 同 ,在 Linux 中 是 char d. name [NAME_MAX 十 1]。 
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if (ac == 1) 
do lst "on um 
else 


while ( 一 一 ac 51 
printf(" $ s;kn", « ttav o; 


do ls( * av); 


void do ls( char dirname[  ) 
f * 
* list files in directory called dirname 
"S 
{ 
DIR # dir_ptr; /* the directory «/ 


struct dirent * direntp; /* each entry «/ 


if( (dir ptr = opendir( dirname ) ) == NULL) 
fprintf(stderr,"lsl; cannot open X s\n", dirname); 
else 
{ 
while ( ( direntp = readdir( dir ptr )} 2) | = NULL?) 
printf(" * sin", direntp —d name ); 
closedir(dir ptr); 


将 上 述 代 码 编 译 运 行 , 并 将 输出 与 标准 的 Ts 的 输出 做 比较 ， 


$ cc -o lsi lsl.c 
5 isi 


s. tar 
taill 
Makefile 
lsl.c 
1s2.c 
chap03 
old src 
docs 

ls] 
statl.c 


statdemo.c 
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taill.c 


S ls 
Makefile docs  lsi.c old src  statl.c taill 
chap03 lsl ls2.c  s.tar statdemo.c  taill.c 


$ 


还 能 做 什么 


看 来 ls 的 第 一 个 版 本 还 不 错 , 但 是 以 下 功能 还 需要 加 进去 。 

(1) 排序 

ls] 的 输出 没有 经 过 排序 ,解决 办 法 ; 把 所 有 的 文件 名 读 人 一 个 数组 ,用 qsort ig LIUC 
组 排序 。 

(2) 分 栏 

标准 的 la 的 输出 是 分 栏 排 列 的 ,有 些 以 行 排序 输出 ,有 些 以 列 排 序 输出 。 解 决 开 法 : 先 
把 文件 名 读 人 数组 ,然后 计算 出 列 的 宽度 和 行 数 。 

C3)“. ”文件 

isl WHT“. ”文件 ,而 标准 的 ls 只 有 在 给 出 -a 选项 时 才 会 列 出 这 些 文件 。 解 决 办 法 : 
使 1s1 能 够 接收 选项 -a, 并 在 没有 -a 的 时 候 不 显示 隐藏 文件 。 

OD 选项 -1] 

和 如果 选项 里 有 一 1, 标 准 的 ls 会 列 出 文件 的 详细 信息 ,而 isl 不 会 。 解 决 办 法 : 要 解决 这 
个 问题 不 是 太 容 易 , 因 为 dirent 结 枸 中 没有 提供 所 需要 的 信息 ,如 文件 大 小 .文件 所 有 者 等 。 
如 果 文 件 的 这 些 信 息 不 是 存 铺 在 目录 中 ,那么 它们 会 存储 在 什么 地 方 呢 ? 


3.6 编写 Is -1 


ls 要 做 两 件 事情 ,一 是 列 出 目录 的 内 容 , 二 是 显示 文件 的 详细 信息 ,这 实际 上 是 两 件 不同 
的 工作 ,目录 包 例文 件 名 ,文件 信息 则 需要 从 另外 的 途径 获得 , 接 下 来 从 3 个 问题 人 手 , 来 解 
决 文件 信息 显示 的 问题 。 


3.6.1 问题 1: ls -上 能 和 做 些 什 么 
先 来 看 ls -1 的 输出 ， 





sls -1 
total 108 
-IW-rW-r-- bruce users 345 dul 29 11:05 Makefile 
-rw-rw-r-- bruce Users 27521 Aug 1 12;14 chapo3 
-rw-r--r-- bruce Users 723 Feb 9 1988  lsl.c 
bruce Users 3045 Feb 15 03:51 ls2.¢ 


bruce Users 1024 Aug 1 / 12114 old src 


2 

1 
drwxrwxr-x 2 bruce Users 1024 Aug 1 .12;15 docs 

1 

-rw-r--r-- 1 

2 


drwxrwxr-x 
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-—rw-rw-r-- 1 bruce Users 30720 Aug 1 12;05 s.tar 

-rw-r--r-- 1 bruce support 9846 Feb 18  17;15  statl.c 

-—rw-r--r-- 1 bruce support 19i Feb a 1988  statdemo.c 

-rwxrwxr-x 1 bruce Users 37351 Aug 1 12:13 taill 

-Yw—r--r-- 1 bruce Users 1416 Aug 1 12:05 taill.c 

-rw-r-—r-- 1  cse215 cscie215 574 Feb 9 1998  writable.c 

$ 

每 行者 包含 7 个 字段 。 

模式 (mode) 每 行 的 第 个 字符 表示 文件 奖 型 。“- ”代表 普通 文件 ,“d” 代 表 目 
录 , 其 他 的 类 型 以 后 还 会 遇 到 ，。 
接 下 来 的 3 个 字符 表示 文件 访问 权限 ,分 为 读 权 限 、 写 权限 和 执行 
权限 ,又 分 别针 对 3 种 对 象 ; 用 户 、 同 组 用 户 和 其 他 用 户 ,所 以 一 共 
需要 9 位 来 表示 。 从 前 面 的 1s -1 的 输出 中 可 以 看 出 ,所 有 的 文件 
和 日 录 对 所 有 用 户 都 是 可 读 的 ,只 有 文件 的 所 有 者 才能 对 文件 进 
行 修改 ,所 有 用 户 都 有 taill 的 执行 权限 。 

链接 数 (links) 链接 数 指 的 是 该 文件 被 引用 的 次 数 , 这 方面 的 内 容 将 在 下 一 章 
介绍 。 

文件 所 有 者 towner) 指出 文件 所 有 者 的 用 户 名 ， 

组 Cgroup) 指 文件 所 有 者 所 在 的 组 。 有 些 版 本 的 ls 显示 组 名 。 

大 小 (size) 第 五 齐 显 示 文 件 的 大 小 。 在 前 面 的 ls -1 的 输出 中 ,所 有 的 目录 大 
小 相等 ,都 是 1024 字 节 ,因为 目录 所 占 空间 的 分 配 是 以 块 (block) 
为 单位 的 ,每 个 块 512 字 节 ,所 以 目录 的 大 小 经 常 是 相等 的 。 如 果 
是 一 般 的 文件 ,size 列 则 显示 了 文件 中 数据 的 实际 字 节 数 。 

最 后 修改 时 间 文件 的 最 后 修改 时 间 。 和 如 果 是 较 新 的 文件 ,会 列 出 月 ,日 和 时 刻 ， 

(last~modified) ”对 于 较 老 的 文件 ,只 能 列 出 月 、 自 和 年 。 

文件 名 Cname) 文件 名 


3.6.2 问题 2; ls -1 是 如 何 工作 的 
如 何 得 到 文件 的 信息 呢 ? 在 键盘 上 输入 ; 


5 man -kfile | grep - 


i information 


在 有 些 系统 上 可 以 得 色 有 用 的 参考 信息 ,有 些 却 不 可 以 ， 因为 这 些 系统 使 用 的 术语 是 
文件 状态 (file status}) 而 不 是 文件 信息 Cile information) 8& # XHA LE Cfile properties) 来 代 
表 文件 的 各 种 信息 。 提 取 文 件 状态 的 系统 调用 是 stat, 


3,6.3 用 stat 得 到 文件 信息 
图 3. 3 显示 了 stat 的 工作 方式 。 
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stat(name, ptr) 


将 name 所 指定 的 文件 信 
息 读 入 一 个 结构 中 。 





3.3 用 stat 读 取 文 件 的 属性 


磁盘 上 的 文件 有 很 多 属性 ,如 文件 大 小 ,文件 所 有 者 的 ID 等 。 如 果 需 要 得 到 文件 属性 ， 
进程 可 以 定义 一 个 结构 struct stat, 然 后 调用 stat, 告 诉 内 核 把 文件 属性 存放 到 这 个 结构 中 。 











Stat 
目标 得 到 文件 的 属性 
头 文件 # include <sys/stat. h> 
函数 原型 int result 一 stat(char * fname，struct stat * bufp) 
参数 fname ”文件 名 
bufp 指向 buffer 的 指针 
返回 值 34 遇 到 错误 
0 成 功 返 回 
stat 把 文件 fname 的 信息 复制 到 指针 bufp 所 指 的 结构 中 。 下 面 的 代码 展示 了 如 何 用 
stat 来 得 到 文件 的 大 小 : 
/x filesize.c — prints size of passwd file */ 
# include <stdio. h> 
# include <‘sys/stat. h> 
int main() 
{ 
struct stat infobuf; /* place to store info x/ 
if ( stat( "/etc/passwd", &infobuf) == -1) /* get info */ 
perror( "/etc/passwd") ; 
else 


printf(" The size of /etc/passwd is % d\n", 
infobuf.st size); 


} 


stat 把 文件 的 信息 复制 到 结构 infobuf 中 ,程序 从 成 员 变 量 st_size 中 读 到 文件 大 小 。 
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3.6.4 stat 提供 的 其 他 信息 
stat 的 联机 帮助 和 类 文件 /usrrinclude/sysrstat,h 描述 了 struct stat 的 成 员 变 量 ， 


st mode AL PESE SE RO YE np LER 
st uid 用 户 所 有 者 的 ID 

st gid 所 属 组 的 ID 

st_ size 所 占 的 字 节 数 

st nlink 文件 链接 数 

st_mtime 文件 最 后 修改 时 间 

st atime 文件 最 后 访问 时 间 

st ctime SC (T PE i Js cS EST T 


stat 结构 中 其 他 未 被 ls -1 用 到 的 成 员 变量 未 在 这 里 列 出 下面 的 例子 fileinfo. c 得 到 
以 上 这 些 属性 ,并 显示 出 来 。 


/* Fileinfo.c ~ use stat() to obtain and print file properties 
x ^ some members are just numbers... 

xf 

# include «stdio.h— 

# include « sys/types.h- 


H include < sys/ stat. h 


int main(int ac, char # av[ j) 


i 
&truct stat info; /* buffer for file info x/ 
if (ac71) 
if(C stat(av[1], &info) | = -1)i 
Show stat info( av[1], &info 5; 
return 0; 
} 
else 
perror(au[1]); /* report stat() errors &/ 
return 1; 


} 


show_stat_info(char * fname, struct stat * buf) 
/x 
é 


* displays some info from stat in a name = value format 


af 

i 
printf(". mode: %o\n", buf-—-st mode); /* type * mode x/ 
printf(" links: *d\n", buf —st nlink); is ft links s/ 
printf(" user ; &dVin", buf —st uid; /* user id #/ 


printf(" group: *d\n", buf —»st gid); /* group id «/ 
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printf(" size; * din", buf -st size); fx file size x/ 
printf(" modtime : & din", buf —>st_mtime); /* modified «/ 
printf(" name ; % s\n", fname 5; /* filename 长 7 


4 
i 


编译 并 运行 feinfo, 并 把 它 跟 Is. -1! 作 对 比 ，; 


$ ec -ofileinfo fileinfo.c 


$ ./fileinfo fileinfo.c 


mode: 
links; 
user: 
group: 
size: 
modtime: 


name: 


100664 

1 

500 

120 

1106 
965158604 


fileinfo.c 


$ la -1 fileinfo.c 


-rw—rw-r-- 1 bruce users 1106 Aug 1 15:36 fileinfo.c 


3.6.5 如 何 实 现 


链接 数 (inks) ,文件 大 小 (size) 的 显示 都 没有 问题 ,最 后 修改 时 间 (modtime)? 是 time, t 类 
型 的 ,可 以 用 ctime 将 其 转化 成 宇 符 囊 ,也 没 问 题 ， 
fileinfo 将 模式 (mode) 字 段 以 数字 形式 输出 ,然而 需要 的 是 如 下 的 形式 ; 


—-rW-IW-I-- 


Zh TU P HO A BS Coser) 和 弓 (group) 字 段 都 是 数值 ,而 显示 出 来 的 应 该 是 用 户 和 名利 
组 名 ,为 了 完善 ls - 1, 必须 进一步 处 理 模 式 ,用户 名 利 组 的 显示 。 


3.6.6 将 模式 字段 转换 成 字符 


文件 类 型 和 许可 权限 是 如 何 存储 在 st mode 中 ? 又 如 何 将 它们 转 成 10 个 字符 的 串 ? A 
进 制 的 100664 X, S" — rw -rw-r-- ”有 什么 关系 呢 ? 对 这 3 PBN ES Rig RT 


的 内 容 。 


st mode 是 一 个 16 位 的 二 进 制 数 ,文件 类 型 和 权限 被 编码 在 这 个 数 中 ,如 图 3.4 Br. 


type user group other 





sticky 





TOTTE 


suid 
sgid 


| J | | 








1 5 
u 


Xx T wW x 








图 3.4 文件 类 型 与 许可 权限 
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其 中 前 4 位 用 作文 件 类 型 ,最 多 可 以 标识 16 种 类 型 ,日 前 已 经 使 用 了 其 中 的 了 个 ， 

接 下 来 的 3 位 是 文件 的 特殊 属性 ,1 代表 具有 某 个 属性 ,0 代表 没有 ,这 3 位 分 别 是 set- 
user - ID f set- group - ID 位 和 sticky 位 ,它们 的 会 六 以 后 介绍 。 

最 后 的 9 位 晨 许 可 权限 ,分 为 3 组 ,对 应 3 种 用 户 ,它们 是 文件 所 有 者 、. 同 组 用 户 和 其 他 
用 户 。 其 他 用 户 指 与 用 户 林 在 同一 个 组 的 人 。 每 组 3 位 ,分 别 是 读 . 写 和 执行 的 权限 。 相 应 
的 地 方 如 果 是 1, 就 说 明 该 用 户 拥有 对 应 的 权限 ,0 代表 没有 。 

l. 字段 的 编码 


把 多 种 信息 编码 到 一 个 整数 的 不 同 字段 中 是 一 种 常用 的 技术 ,如 : 














编码 的 合子 
617 — 495 — 4204 电话 时 码 { 区 号 - BS - 线 号 》 
027 - 93 - 1111 社会 保障 号 





128. 103, 33, 100 IP 地 址 


2， 如 何 读 取 被 编码 的 值 
怎么 来 读 取 被 编码 的 值 呢 ? 比如 怎么 知道 212 ~ 222 - 4444 所 对 应 的 区 号 是 212? 很 简 


单 ,一 种 方法 是 将 号 码 的 前 3 位 同 212 比较 , 另 一 种 方法 是 将 暂时 不 需要 的 地 方 置 0, 这 里 把 
ra i ee RS SUE 7 位 置 0, 然 后 同 212 - 000 - 0000 比较 。 


为 了 比较 ,把 不 需要 的 地 方 置 0, 这 种 技术 称 为 掩 码 (masking) ,就 如 同 带 上 面具 把 其 他 


部 位 都 速 起 来 ,就 只 留 下 眼睛 在 和 外面。 这 里 用 ~- 系列 掩 码 来 把 st mode 的 值 转化 成 ls -1 要 
显示 的 字符 串 。 


子 域 编码 (subfield coding) 是 系统 编程 中 一 种 重要 且 常 用 的 技术 ,以 下 从 四 方面 详细 介 
银子 域 编码 与 掩 码 。 


(1) EBRE E 
TEIG USOS TE ENS BUS OE ELBS BUR AA íUE. 
(2) 整数 是 bit 组 成 的 序列 


整数 在 计算 机 中 是 以 bic 序列 的 形式 存在 的 ,图 3.5 显示 了 如 何以 二 进 制 的 0 和 1 的 串 
来 表示 十 进 制 的 215。 想 -- 下 00011010 表示 十 进 制 的 儿 ? 


1005 10% J's 


Ennoonnn 


128 64 32 i6 8 4 2 | 
JODE IE ! ü 


图 3.5 在 整数 和 二 进 制 数 之 间 转 换 











fe | 








(3) ARISE A 
4 0 作 位 与 C&) 操 作 可 以 将 相应 的 bit 置 为 0, 图 3.6 是 八进制 的 100664 通过 位 与 操作 
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把 一 些 bit 置 为 0。 注意 ,数字 中 的 某 些 1 是 如 何 被 置 为 0 的。 


————————————————s— 4 


图 3.6 位 与 操作 


(4) 使 用 八进制 数 

直接 处 理 二 进 制 数 是 很 枯燥 乏味 的 。 如 同 处 理 一 长 串 十 进 制 数 时 人 们 常 将 它们 三 位 一 
组 分 开 ( 如 23,234,456,022) 一 样 ,一 种 简化 的 方法 是 将 二 进 制 数 每 三 位 分 为 一 组 来 操作 ,这 
就 是 八进制 数 (0 至 7)。 

如 可 以 把 二 进 制 的 1000000110110100 分 为 1,000,000,110,110,100, 从 而 得 到 八进制 
的 100664, 这 样 更 容易 理解 。 

3. 使 用 掩 码 来 解码 得 到 文件 类 型 

文件 类 型 在 模式 字段 的 第 一 个 字 节 的 前 四 位 ,可 以 通过 掩 码 来 将 其 他 的 部 分 置 0, 从 而 
得 到 类 型 的 值 。 

TE — sys/stat. hb 这 中 有 以 下 定义 ， 


#define S IFMT 0170000 /* type of file x/ 
#define S IFREG 0100000 /* regular x/ 

define S IFDIR 0040000 /x directory */ 

f define S IFBLK 0060000 /* block special «/ 

S define S IFCHR 0020000 /* character special x/ 
define S IFIFO 0010000 /* fifo x/ 

#define S IFLNK 0120000 /* symbolic link x/ 
define S IFSOCK 0140000 /* socket x/ 


S IFMT 是 一 个 掩 码 , 它 的 值 是 0170000, 可 以 用 来 过 滤 出 前 四 位 表示 的 文件 类 型 。S_ 
IFREG 代表 普通 文件 , 值 是 0100000,S_IFDIR 代表 目录 文件 , 值 是 0040000。 下 面 的 代码 : 


if ((info.st mode & 0170000) == 0040000 ) 


printf("this is a directory"); 


通过 掩 码 把 其 他 无 关 的 部 分 置 0, 再 与 表示 目录 的 代码 比较 ,从 而 判断 这 是 否 是 一 个 
目录 。 
RA ne iof CORN: 


/* 
* File type macros 


x/ 


f define S ISFIFO(m) (((m)&(0170000)) == (0010000)) 











(078 Unix/Linux 编程 实践 教程 





f define S 1SDIR(m) — (COm)&(01700000) == (06040000)) 
zx define 8 ISCHR(m) — (((m)&(0170000)) == (00200005) 
# define S ISBLEK(m) — (((m)&(0170000)) == (00600003) 
# define S ISREG(m)  (((m)&(0170000)) == (01000000) 
使 用 宏 的 话 就 可 以 这 样 写 代码 ， 


if (S_ISDIR( info. st_mode) } 


Printft "this is a directory"); 


4. 解码 得 到 许可 权限 

模式 字段 的 最 低 9 位 是 许可 权限 , 它 标 识 了 文件 所 有 者 ,组 用 户 、 其 他 用 户 的 读 , 写 ,执行 
权限 。ls 将 这 些 位 转换 为 短 横 和 字母 的 串 。 在 <sysystat. h>> 中 每 一 位 都 有 相应 的 掩 码 ,下 
面 的 代码 给 出 了 如 何 使 用 的 例子 ， 


fe 
* This function takes a mode value and a char array 
* and puts into the char array the file type and the 
* nine letters that correspond to the bits in mode, 
* NOTE; It does not code setuid, setgid, and sticky 
* codes 

LP 

void mode to letters( int mode, char str[] ) 

H 


strcpy( str, "------- --- "y; /* default = no perms */ 
if ( $ ISDIR(mode) ) str[O; = 'd'; f=» directory? #/ 

if ( S_ISCHR(mode} ) str[L9 = 'c'; /* char devices +/ 

if( S ISBLKCmode) ) str[0; = 'b'; /* block device x/ 

if ( mode & 8. IRUSR ) stri 1] = 'r'; /* 3 bits for user «/ 


if ( mode & $ IWUSR 2 str[2] = 'w'; 
if ( mode & 5. IXUSR ) str[3] = 'x' 


if ( mode & S IRGRP ) str[4: = ‘rr; /* 3 bits for group x/ 
if ( mode & S_IWGRP ) str[5? = 'w'; 
if ( mode & S IXGRP ) str[ 


6; = Xt; 


if ( mode & 8 IROTH ) str|7] = 'r'; /* 3 bits for other &/ 

if ( mode & S IWOTH ) str[8] = "w^; 

if ( mode & 5 IXOTH ) str[9] = 'x: 
t 





5， 解 码 并 篇 写 ls 
到 此 为 止 ,已 经 可 以 正确 处 理 文件 大 小 .链接 数 ,文件 名 .模式 ,最 后 修改 时 间 ， 最 后 还 
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有 一 个 要 解决 的 问题 是 文件 所 有 者 Cusez 和 组 (group) 的 表示 。 
3.6.7 将 用 户 / 组 1D 转换 成 字符 串 


TE. struct stat 中 ,文件 所 有 者 和 组 是 以 1D 的 形式 存在 的 ,然而 ls 要 求 输出 用 户 名 和 组 
名 ,如 何 根据 ID 找到 用 户 各 和 组 名 呢 ? 

可 以 试 着 在 联机 帮助 中 查找 关键 字 username, uid. group AA T (E ARS SAH 
统 中 得 到 的 结果 很 不 相同 。 下 面 是 一 些 说 明 ， 

(1) /etc/passwd 包含 用 户 列表 

回想 - -下 登录 过 程 ,输入 用 户 名 和 密码 ,经 过 验证 后 登录 成 功 ,出 现 提示 符 。 系 统 怎么 
知道 用 户 名 和 密码 是 正确 的 ? 

这 就 涉及 到 ,etc/passwd 这 个 文件 , 它 包 含 了 系统 中 所 有 的 用 户 信息 ,下 面 是 一 个 例子 : 








FOOL :WHERAAdlOWUxypE ,0 ;0:root;/Din/bash 

bin: * :1;1-:/bin;/bin: 

daemon; * ;2;2:;daemon:/sbin: 

snith:xlmEPcp4Tnokc 3768 -3073 :Jame Q Smith: /home/s/smith/: 
/shells/tcsh 

fred;mSuVNOFACRTmE:20359 :550 :Fred:/home/f/fred:/shells/tosh 

diane ;70US8f1Psrec¥ -20555-550-Diane Abramov ;/home/d/diane: 
/shelle/tesh 

ajr ;WitmEBWylarlw-: 3607-3034 :Rnn Reuter: /home/a/ajr;/shells/bash 





这 是 个 纯 文本 文件 ,每 一 行 代表 -个 用 户 , 用 冒号 “:” 分 成 不 同 的 字段 ,第 一 个 字段 是 用 
户 名 ;第 二 个 字段 是 密码 ,第 三 个 字段 是 用 户 ID, 第 四 个 字段 是 所 属 的 组 , 接 下 来 的 是 用 户 的 
全 名 EH ALPE shell 程序 的 路 径 。 所 有 的 用 户 对 这 个 文件 都 有 读 权限 ,关于 这 个 文 
件 的 详细 信息 ,参见 联机 帮助 。 

似乎 使 用 这 个 文件 就 可 以 解决 用 户 ID 和 胀 户 各 的 关联 问题 ,只 需 搜索 用 户 ID ,然后 就 
可 以 得 刘 相 应 的 用 户 名 。 然 而 在 实际 应 用 中 并 不 是 这 样 做 的 ,搜索 文件 是 一 件 很 繁琐 的 二 
fF ,而 且 对 于 很 多 网 络 计算 系统 ,这 种 方法 是 不 起 作用 的 。 

(2) /etc/passwd 并 没有 包括 所 有 的 用 户 

每 个 Unix 系统 都 有 /etc/passwd 这 个 文件 ;但 它 并 没有 包括 所 有 的 用 户 , 在 有 些 网 络 计 
算 系 统 中 ,用 户 要 能 够 登录 到 系统 中 的 任何 一 台 主 机 上 ,如 果 通 过 /etc/passwd 来 实现 ,就 必 
须 在 也 有 的 主机 上 维护 用 户 信 息 ,要 修改 密码 的 活 也 必须 修改 所 有 主机 上 的 密码 ,如 果 有 一 
& X SLE; ULT. ,那么 在 宕 机 期 间 的 用 户 变 化 情况 就 无 法 同步 到 这 台 主 机 上 。 

较 好 的 解决 方法 是 在 一 台大 家 都 能 够 访问 到 的 主机 上 保存 所 有 用 户 信息 , 它 被 称 做 
NIS, 所 有 的 主机 通过 NIS 来 进行 用 户 身 份 验证 。 所 有 需要 用 户 信息 的 程序 也 从 NIS ELA 
取 。 而 本 地 只 保存 所 有 用 户 的 一 个 子 集 以 备 离线 操作 。 在 联机 帮助 中 有 NIS i i 
信息 。 

(3) 通过 getpwuid 来 得 到 完整 的 用 户 列表 

RI ELS 23: PE AS getpwuid 来 访问 用 户 信息 ,如 果 用 户 信息 保存 在 /etc/passwd rfi, BELA 
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getpwuld 会 查找 /etcypasswd 的 内 容 , 如 果 用 户 信息 在 NIS 中 ,getpwuid 2M NIS PRE 
息 , 所 以 用 getpwuid 使 程序 有 很 好 的 可 移植 性 。 . 

getpwuid 需要 UIDCuser ID) 作 为 参数 ,返回 -个 指向 struct passwd 的 指针 ,这 个 结构 
E X. TE / usr/inelude/pwd. h rf. 


/* The passwd structure */ 


struct passwd / 


char * pw name; /* Username x/ 

char * pw passwd; /* Password */ 

. uid t pw uid; /* User ID «/ 

. gid t pw gid; /* Group ID #/ 

char x pw gecos; /* Real name «/ 

char * pw dir; /* Home directory #/ 
char * pw shell; /* Shell Program =; 


I 


这 下 是 ls -1 的 输出 中 需要 的 : 





fat 
* returns a username associated with the specified uid 
* NOTE: does not work if there is no username 
xf 
char * uid to name(uid t uid) 
{ 
return getpwuid( uid) —>pw_name; 


} 


这 段 代码 很 简单 ,但 还 不 够 健壮 ,如 果 uid 不 是 一 个 合法 的 用 户 ID, BR getpwuid 返回 空 
指针 NULL ,这 时 getpwuid(uid) 一 > pw name 就 设 有 春 义 ,这 种 情况 会 发 生 吗 ? 常用 的 ls 
命令 有 一 种 处 理 这 种 情况 的 办 法 。 

(4) UID AW MM APS 

假设 在 一 台 Unix 主机 上 有 一 个 账号 ,用 户 名 是 pat, 用 户 ID 是 2000, 创 建 了 一 个 文件 ， 
这 个 文件 的 st uid 的 值 就 是 2000, 

假设 一 段 时 间 以 后 你 搬 走 了 ,系统 管理 员 于 是 把 这 个 账号 删除 ,在 passwd 中 不 再 有 pat 
这 一 行 , 这 时 如 果 getpwuid 得 到 的 参数 是 2000, 它 就 会 返回 NULL, 

标准 的 Is 如 果 导 到 这 种 情况 ,会 打印 出 UID, 

当 新 加 入 一 个 用 户 时 ,新 用 户 有 可 能 与 一 个 号 被 删除 的 用 户 有 相同 的 UID, 这 时 , 老 用 
户 所 留 下 来 的 文件 会 被 用 户 所 拥有 ,新 用 户 对 这 些 文件 具有 所 有 的 权限 。 

最 后 一 个 问题 是 组 ID 如 何 处 理 ? 什么 是 组 ?什么 是 组 ID? 

(5) /etc/group 是 组 的 列表 

对 一 台 公 司 里 的 主机 而 言 ,可 能 要 将 用 户 分 为 不 同 的 组 ,如 销售 人 员 一 组 .行政 人 员 一 
组 等 。 要 是 在 学校 里 ,可 能 有 教师 组 和 学 生 组 。Unix 提供 了 进行 组 管理 的 手段 ,文件 
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/etc/group 是 一 个 保存 所 有 的 组 信息 的 文本 文件 : 


root:..D.root 

other;:1: 
bin::2:root,bin,daemon 
Sy8::3:root,bin,sys,adm 
adm; ;4 ;root,adm, daemon 
uucp:;5;root,uucp 
mail;:6;root 

tty::7 :reot, tty, adm 

1p; :8,root, 1p,adm 


B—-TPFRAAA ,第 二 个 是 组 密码 ,这 个 字段 极 少 用 到 ,第 三 个 是 组 IDCGIDO ,第 四 个 


基 组 中 的 成 员 列表 。 
(60 用户 可 以 同时 属于 多 个 组 
passwd 文件 中 有 每 个 用 户 所 属 的 组 ,实际 .E 那 里 列 出 的 是 用 户 的 主 


组 (primary group), 


用 户 还 可 以 是 其 他 组 的 成 员 , 要 将 用 户 添加 到 组 中 ,只 要 把 它 的 用 户 各 涨 加 到 /etec/group 中 
这 个 组 所 在 行 的 最 后 一 个 字段 即 可 。 在 刚才 的 重子 中 ,用户 adm 同时 属于 sys adm. tty. Ip 
等 多 个 组 。 这 个 列表 在 处 理 组 访问 权限 时 会 被 用 到 。 例 如 :个 文件 属于 lp 组 , 且 组 成 员 有 


这 个 文件 的 写 权 限 , 所 以 用 户 adm 就 可 以 收 改 这 个 文件 。 
(7) 通过 getgrgid 来 访问 组 列表 


在 网 络 计算 系统 中 ,组 信息 也 被 保存 在 NIS rH, Unix 系统 提供 getgrgid | Xe BE Beh Sc 
现 的 差异 。 用 这 个 销 数 ,用 户 可 以 得 到 组 名 而 不 用 操心 实现 的 细节 ，getgrgid 的 用 户 手册 对 





这 个 沙 数 及 相关 函数 做 了 详细 解释 。 在 ls -1I 中 ,可 以 这 样 得 到 组 名 ， 


fe 
* returns a groupname associated with the specified gid 
x NOTE: does not work if there is no groupname 
ef 
char * gid to name(gid t gid} 
1 
return getgrgid{ gid) —»gr name; 
) 


3.6.8 编写 Is2.¢ 


对 is -1 的 每 一 项 输出 ,都 有 办 法 将 它们 转换 为 用 户 可 理解 的 格式 
就 得 到 了 以 下 代码 : 


/* ls2.c 
* purpose list contents of directory or directories 
* action if no args, use . else list files in args 


* note uses stat and pwd. h and grp. h 


. 把 它们 综合 起 来 ， 
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x BUG: try 1s2 /tmp 

x 

it include < stdio. h^» 

# include <(sys/types. h= 
d include —dirent. ho 


4 include <Usys/stat. h> 


void do_ls€char[]); 

void dostat(char +}; 

void show file info( char * , struct stat +); 
void mode to letters( int , char [ |}; 

char s uid to name( uid t ); 

char + gid to name( gid t); 


main(int ac, char * av[ ]) 


1 
if (ac == 1) 
do ls( "." D; 
else 


while ( -~ac }{ 
printf("%s;\n", x ++av); 


do ls( * av 5; 


void do ls( char dirname[] ) 
fx 
* list files in directory called dirname 
af 
{ 
BIR * dir ptr; /* the directory */ 


struct dirent + direntp; /* each entry x/ 


if { ( dir ptr = opendir( dirname ) ) == MULL } 
fprintf(stderr, "lsl: cannot open % s\n", dirname); 


else 


{ 
while ( ( direntp = readdir( dir ptr ) ) 1 = NULL) 


dostat( direntp 7d name ); 
closedir(dir ptr); 


} 


void dostat( char « filename ) 
i 


D 


struct stat info; 
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if ( stat(filename, &info) == -1) /* cannot stat «/ 
perror( filename J; /* say why */ 
else /* else show infu «/ 


show file info( filename, &info }; 


void show file info( char «x filename, struct stat * info p) 
fe 
* display the info about filename. The info is stored in struct at * info p 
a? 
i 
char xuid to name(), * ctime(?, *gid to name(), * filemode()- 
void mode to letters(); 


char modestr|11]; 
mode to letters( info pp- st mode, modestr ); 


printf( "$s" , modestr >; 

printf( "* 4d " , (int) info p —»st nlink); 

printf( "€ ~ Bs " , uid to name(info p—»st uid) ); 
printf( "& -8s " , gid to nametinfo p ->st gid) 5; 
printf( "* üld " , (1ong)info _p->st_size); 

printf( "*.12s " 4+ ctime(&info p—7st mtime)); 
printf( "$ s\n" 


, filename 5; 


"E 
* utility functions 


af 


/* 
* This function takes a mode value and a char array 
* and puts into the char array the file type and the 
* nine letters that correspond to the bits in mode. 
* NOTE: It does not code setuid, setgid, and sticky 
* codes 

*/ 

void mode to letters( int mode, char str[ |) 

| 


strepy( str, "----—----- "j; /* default = no perms */ 
if ( S ISDIR(mode) ) str[O! = 'd'; /* directory? x/ 
if ( S ISCHR(mode) ) sti[0] = 'c'; /* char devices «/ 


if ( 8 ISBLE(mode) ) str[0] 


T 
c 


/* block device x/ 


if ( mode & 8 IRUSR ) str[1] : /* 3 bits for user «/ 


m 
4 
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if ( mode & 5, IWUSR } stz[2] = 'w'; 
if ( mode & S. IXUSR ) str[3] = ‘x’; 
if ( mode & S IRGRP } str[4] = 'r'; /* 3 bits for group «/ 
if ( mode & 8 IWGRP } str[5] = 'w*; 
if ( mode & S IXGRP ) str[6] = 'x'; 
if ( mode & 8. IROTH ) str[(7j = irt; /* 3 bits for other «/ 
if ( mode & 5. TWOTH ) str[8] = wt; 
if ( mode & S IXOTE ) str[9] = 'x'; 


# include < pwd., ho 


char * uid to name( uid t uid } 
/* 


* returns pointer to username associated with uid, uses getpw() 


{ 


x/ 


struct passwd + getpwuid(), * pw ptr; 
static char numstr|10]; 


if(( pw ptr = getpwuid( uid} ) == NULLO 
sprintf(numstr," & d", uid); 
return numstr; 

} 

else 


return pw ptr ——-pw name ; 


F 


f include <igrp. i= 


char «gid to name( gid t gid } 


ie 


i 


1 


* returns pointer to group number gid. used getqrgid(3) 


xf 


struct group * getgrgid(), * grp ptr; 
static char numstr[ 10]; 


if ( { grp ptr = getgrgid(gid) ) == NULL }1 
sprintf(numstr," $ d", gid); 
return numstr; 


) 


else 


return grp ptr ——-gr name; 
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将 1s2 的 输出 与 标准 的 ls 对 比 : 


$ ls2 

drwxrwxr-x + 4 bruce bruce 1024 Aug 2 18;18 
drwxrwXr-x 5 bruce bruce 1024 Aug 2 18,14 

-rw-rw-r-- 1 bruce users 30720 © Aug 1 12;05 s.tar 
-IWXTWXE-x 1 bruce users 37351 Aug } 12;13 taill 
-rw-rW-r-- 2 bruce users 345 Jul 29 11;05 Makefile 
-rWw-r--r.-- 1 bruce users 723 Bug 1 14:26  lsl.c 
-rTW-I--rp-- 1 bruce users 3045 Feb 15 03:51 1s2.c 
-rwW-rW-r-- 1 bruce users 27521 &ug 1 12:14 chapd3 
drwxrwxr-x 2 bruce userg 1024 Aug 1 12:14 old src 
drwxrwxr-x 2 bruce users 1824 Aug 1 12;15 does 
-—IWXIWXr-X 1 bruce bruce 37048 Aug 1 14:26 Isl 
-rw-r--r-— l bruce support 946 Feb 18 17:15  statl.c 
-rwxrwXr—x 2 bruce bruce 42295 = Aug 2 18;18  is2 
-rw-r--r-- l bruce support 191 Feb 9 21:01  statdemo.c 
-rw-r--r-- i bruce users i416 Aug 1 12;05 taill.c 
s$ is-1 

total 189 

-YW-rw-r.— 2 bruce users 345 Jul 29  11;05  Makefile 
-rw-rw-r-- 1 bruce users 27521 hug 1 12:14 chapo3 
drwXrwXxr-x 2 bruce users 1024 Aug i 12,15 docs 
—rWXIWXr-X 2 bruce bruce 42235 Aug 2 18;18 1s2 
-YW-r--r-— 1 bruce users 723 «Aug 1 314.26 Ilsi.c 
—-rWXIWXr-X 1 bruce bruce 37048 — hug 1 14;26 isl 
-rw-r--r-- 1 bruce users i045 Feb 15 09-51 Ils2.c 
drwxrwxr_x 2 bruce users 1024 Aug 1 12:14 old src 
-YW-IW-Y-— 1 bruce users 30720 Aug 1 12;05 s.tar 
-rw-r--r-- 1 bruce support 946 Feb 18 17:15  statl.c 
-IW-r--r-- 1 bruce support 131 Feb 9 1998 J statdemo.c 
—YWXIWXY-X 1 bruce userg 37351 Aug 1 12:13 taili 
-rw-r--r-- 1 bruce users 1416 Aug 1 12;05 taill.e 
3 


ls2 的 输出 看 起 来 已 经 很 不 错 了 ,模式 字段 .用 户 名 和 组 名 的 处 理 已 经 完成 。 但 还 有 些 工 
ERM. ER ls 会 显示 记录 总 数 ,1s2 不 会 ,而 且 152 还 没 将 结果 按 文件 名 排序 ,也 不 支持 
选项 -a。 它 还 假设 参数 是 目录 各 。 

1s2 还 有 一 个 致命 的 问题 ,不 能 显示 指定 目录 的 信息 ;你 可 以 试 一 试 ,在 命令 行 输入 ; 
ls2 /tmp。 可 以 在 本 章 结 尾 的 练习 中 修正 这 些 问题 。 
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3.7 二 个 特殊 的 位 


结构 stat 中 的 st_mode MAAS 16 位 ,其 中 4 位 用 作文 件 类 型 ,9 位 用 作 许 可 权限 , 剩 
下 的 3 位 用 作文 件 特殊 属性 。 


3.7.1 set-user- ID 位 


在 这 3 rre SS frm BE set~ user- TD 位 , 它 的 出 现 是 为 了 解决 一 个 重要 的 问题 , 即 用 
户 如 何 更 改 自 己 的 密码 ? 

看 起 来 好 像 很 容易 ,用 passwd 命令 就 可 以 ， 

接 下 来 研究 一 下 passwd 的 工作 原理 , 先 来 看 /eteypasswd 这 个 文件 ,注意 这 个 文件 的 所 
有 者 利文 件 访问 权限 设置 : 











5 ls -1 /etc/pasewd 
-r«-r--r-- 1l root root  B94 Jun 20 19.17  /etc/passwd 


更 改 密码 会 导致 上 述 文件 内 容 的 变化 ,但 是 普通 用 上 户 没有 修改 这 个 文件 的 权限 ,只 有 
root 用 户 才 可 以 修改 它 ,passwd 全 令 怎 么 能 饮 修 改 这 个 文件 呢 ? 

解决 的 办 法 ,不 是 给 所 有 用 户 收 改 这 个 文件 的 权限 ,而 是 给 passwd 命令 一 个 特殊 的 权限 ， 
使 passwd 命令 的 文件 所 有 者 是 root, 而 且 它 的 特殊 属性 中 包含 set -user -1D 位 ,如 下 ， 





$ ls —1 /usr/bin/passwd 
-r-sr-xr-x 1 root bin 15725 Oct 31 1997  /usr/bin/passwd 


SUID 位 告诉 内 核 BTL RE MN RU WEAR ASABE. Ee 
就 是 root, Ifi] root 有 修改 /etc/ passwd 的 权限 ， 

L 是 否 可 以 更 发 其 他 用 户 的 密码 ? 

答案 是否 定 的 ,passwd 命令 知道 是 谁 在 运行 程序 。 它 用 系统 调用 getuid 来 得 到 用 户 ID, 
passwd 命令 是 可 以 修改 /etc/passwd 这 个 文件 ,但 它 只 会 修改 该 用 户 ID 所 对 应 的 密码 。 

2. set- user ID 的 其 他 用 处 

SUID 位 经 常用 来 给 某 些 程序 提供 额外 的 权限 ,比如 系统 中 的 打印 队列 。 有 可 能 同时 有 
很 多 用 户 发 出 打印 请 求 , 但 系统 只 有 一 台 打 印 岂 ,这 时 要 把 打 邹 请 求 都 放 到 打印 队列 中 去 ， 
命令 lpr 负责 把 用 户 要 打印 的 文件 复制 到 一 个 特定 的 系统 目 计 中 去 。 如 果 这 个 自 录 所 有 用 
户 都 有 访问 权限 , 那 将 会 产生 一 些 不 安全 因素 ,恶意 用 户 有 删除 别人 的 打印 作业 的 可 能 。 设 
Æ lpr 的 SUID 位 就 可 以 解决 这 个 问题 ,使 lpr 的 文件 所 有 者 是 root 和 lpr。 当 一 个 普通 用 户 
调用 Ipr 时 ,lpr 就 以 root 或 Ipr 的 权限 运行 ,可 以 对 这 个 系统 目录 进行 操作 ,而 普通 用 户 却 
不 能 直接 对 这 个 日 录 进 行 控制 。 执 行 从 打印 队列 称 除 操作 的 程序 也 是 设置 SUID 的 ， 

一 些 游戏 会 把 成 绩 最 好 的 用 户 的 信息 写 入 数据 库 或 记录 文件 ,可 以 把 这 些 执 行 写 动 作 
的 程序 的 文件 所 有 者 设 为 数据 库 或 记录 文件 的 所 有 者 ,再 设 上 set- user - ID 位 ,这 样 普通 用 
户 玫 可 以 玩 游 戏 , 但 只 有 游戏 程序 才 可 以 修改 成 绩 。 
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3. 检验 SUID tha 
ay ABE iE sys/stat. hb 疙 中 定义 的 掩 码 来 检验 某 一 个 程序 是 否 有 SUID f: 


Hdefine S ISUID O004000 /* set user ID on execution */ 
将 它 转 换 为 二 进 制 ,将 会 看 到 它 正 好 是 3 个 特殊 位 的 第 一 位 ， 


3.7.2 set-group- ID 位 





SOP RARI E for d Foe UE ERE I ST PUR ELS RS RA g 
HER set-group- ID fidi S iE EL BARR i 13 HT SE LA EAE E e HB AE PHP 
运行 一 样 。set- group - ID 位 给 程序 某 一 个 组 的 访问 权限 。 

可 以 通过 sys/stat. h>> 中 定义 的 掩 码 来 检验 某 一 个 程序 是 否 有 set-group-ID 位 : 





+#define S ISGID 0002000 /*set group ID on execution», 


3.7.3 sticky 位 


sticky 位 对 于 文件 和 上 月 有 孙 有 不 同 的 用 途 。 对 于 文件 而 言 , 早 期 的 Unix 系统 经 常 要 在 有 
限 的 内 存 中 同时 运行 很 多 程序 , 它 使 用 到 交换 (swap) 技 术 。 例 如 系统 中 内 存 只 有 1MB fil 
余 宅 间 ,但 系统 要 同时 运行 3 个 程序 ,每 个 需要 0.5MB 的 内 存 , 很 明显 ,剩余 空间 只 人 允许 商 个 
程序 竺 在 内 存 中 。 在 某 个 时 候 如 果 某 个 程序 没 赤 行 ,内 核 会 把 它 临 时 地 存放 到 硬 焕 上 一 个 
岂 诡 换 空间 的 分 区 中 , 空 出 来 的 内 存 可 以 给 其 他 程序 使 用 , 当 在 交换 空 间 中 的 程序 将 要 再 次 
运行 时 ,内核 会 把 它 装 载 到 内 存 中 。 

从 交换 空间 装载 程序 要 比 从 普通 的 硬盘 空间 快 ,在 非 交 撞 空 间 的 硬盘 上 ,程序 可 能 被 分 
成 好 几 志 分 别 存 放 在 多 个 地 方 , 交 换 空间 上 的 文件 是 不 分 块 的 。 

一 些 经 常用 到 的 程序 ,如 编辑 器 .编译 器 和 游戏 ,如 果 位 于 交换 空间 上 ,那么 装载 的 速度 
就 会 快 得 多 。sticky 位 告诉 内 核 即 使 没有 人 在 使 用 程序 ,也 要 把 它 放 在 交换 空间 中 。 程 序 丫 
在 交换 空间 中 ,就 好 像 口香糖 粘 在 鞋子 上 一 样 。 

现在 ,交换 技术 已 经 不 像 以 前 那么 重要 了 ,取而代之 的 是 虚拟 内 存 技术 ,虚拟 内 存 使 得 
可 以 以 更 小 的 单位 ,如 页 (page) ,进行 交换 。 

XT Hoi ei sticky 的 含义 是 不 同 的。 有些 目 录 被 设计 用 来 存放 临时 文件 , 如 /tmp，, 谁 
都 可 以 往 这 里 创建 /删除 文件 ,sticky 位 使 得 目录 里 的 文件 只 能 被 创建 者 删除 。 


3.7.4 用 1s-1 看 到 的 特殊 属性 


正如 刚才 所 看 到 的 ,每 个 文件 有 12 位 的 文件 属性 ,但 ls 只 用 9 个 字符 来 表示 , 它 是 如 何 
来 表示 的 呢 ? 
来 看 下 面 的 例子 : 





-rwsr-sr-t 1 root root 2345 Jun 12 14:02 sample 
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在 许可 权限 部 分 ,用 户 的 x 被 蔚 换 成 s, 代 表 set- user- ID 被 设置 ,组 用 户 的 x 被 替换 s， 
代表 set- group- ID 被 设置 ,其 他 用 户 的 x 被 替换 成 t+, 代表 sticky 被 设置 ,更 详细 的 信息 参 
见 联机 帮助 





3.8 Is 小 结 


本 章 编写 的 ls 程序 可 以 型 出 目录 里 的 文件 ,还 可 以 列 出 文件 的 详细 信息 。 在 分 析 和 实 
现 的 过 程 中 ,应 该 可 以 学 到 Unix 很 多 方面 的 知识 。 

(1) 文件 与 自 录 

Unix 将 数据 存放 于 交 件 中 ,日 录 是 特殊 的 文件 , 它 的 内 容 就 是 其 中 的 文件 和 子 目 录 的 名 
字 , 述 包 会 自己 的 名 字 ,Unix 提供 一 系列 函数 对 目录 操作 ,打开 , 读 , 定 位 ,关闭 等 ,但 不 提供 
SAH RR. 

(2) 用 户 与 组 

系统 中 的 每 个 用 户 都 有 用 户 名 和 用 户 ID, 人 们 可 以 用 用 户 名 登录 到 系统 。 系 统 通过 
UID 来 区 分 不 同 用 户 的 文件 。 每 个 用 户 都 属于 至 少 一 个 组 。 每 个 组 都 有 组 名 和 给 ED. 

(3) 文件 属性 

每 个 文件 都 有 很 多 属性 ,程序 通过 系统 调用 stat 来 得 到 文件 的 属性 。 

(4) 文件 的 所 有 关系 

每 个 文件 都 有 文件 所 有 者 ,文件 所 有 者 的 ID 是 文件 属性 的 一 部 分 。 同 样 的 每 个 文件 都 
属于 某 个 组 ,组 ID 也 是 文件 属性 的 一 部 分 。 

(5) 许可 权限 

文件 的 许可 权限 规定 了 哪 种 用 产 可 以 进行 品 些 操作 ,有 3 种 用 户 , 文件 所 有 者 、 册 组 用 
户 和 其 他 用 户 ,3 种 操作 : E ERU. 


3.9 设置 和 修改 文件 的 属性 


文件 有 很 多 属性 ,js ~1 可 以 列 出 来 ,这 些 属性 是 如 何 建 立 的 ? 是 否 可 以 改变 文件 的 属 
性 ?如 果 可 以 ,如 何 改 ? 如 果 不 可 以 ,为 什么 * 这 是 接 下 来 要 介绍 的 问题 ， 


-rW-r--r-- l bruce users 3045 Feb 15 03:51  1ls2.c 
从 左 到 右 来 看 文件 152. c 的 属性 。 
3.9.1 文件 类 型 


文件 的 类 型 有 普通 文件 .目录 文件 .设备 文件 .socket 文件 .符号 链接 文件 、 命 名 管道 
(named pipe) 文 忻 等 。 

(1) 文件 类 型 的 建立 

文件 类 型 是 在 创建 文件 的 时 候 建 立 的 ,如 用 系统 调用 creat 建立 一 个 普通 文件 。 其 他 类 
型 的 文件 如 自 录 、 设 备 等 ,可 使 用 不 同 的 函数 创建 。 
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(25 修改 文件 类 型 
文件 一 经 创建 ,类 型 就 无 法 修改 ,虽然 在 童话 里 ,南瓜 可 以 变 成 马车 ,但 这 里 的 文件 类 型 
是 不 能 变 的 。 . 


3.9.2 许可 位 与 特殊 属性 位 


每 个 文件 都 有 9 位 的 许可 权限 和 3 位 的 特殊 属性 ,它们 是 在 文件 创建 的 时 候 建立 的 , 创 
建 以 后 ,它们 可 以 被 chmod 系统 调用 修改 。 

OD 建立 文件 的 模式 

creat 的 第 二 个 参数 指定 了 要 创建 文件 的 许可 位 ;如 ; 


fd = creat( "newfile", 0744 ); 


指定 新 创建 文件 的 许可 位 为 rwxr-r--。 

这 个 参数 只 是 请 求 , 而 不 是 命令 。 内 核 会 通过 “新 建文 件 撞 码 ”(file- creation- mask) 
来 得 到 文件 的 最 终 模 式 。“ 新 建文 件 掩 码 " 是 一 个 很 有 用 的 系统 变量 , 它 指定 哪些 位 需要 
被 关 掉 。 例 如 要 防止 程序 创建 能 被 同 组 用 户 和 其 他 用 户 修 改 的 文件 ,那么 可 以 通过 关 掉 
----w--w- 来 实现 。 这 可 以 通过 把 “新 建文 件 掩 码 ” 的 值 设 为 八进制 数 022 来 实现 。 
[EE 


umask( 022 }; 


这 里 的 umask 是 一 个 系统 命令 ,可 以 改变 变量 umask MATA. 
(2) 改变 文件 的 模式 
程序 可 以 通过 系统 调用 chmod 来 改变 文件 的 模式 ,如 : 


chmod( "/tmp/myfile", 047645 ; 
chmod( "/tmp/myfile",S ISUID|S IRWXU| S IRGRP|S IWGRP|S_IROTH ); 


上 述 两 条 指令 的 作用 相同 ,第 一 条 是 八进制 来 表示 ,第 一 条 是 用 一 sysystat. h> rag X. 
的 符号 来 表示 。 后 者 有 了 明显 的 优点 , 当 系 统 定义 的 许可 位 的 值 改变 时 ,无 需 修 改 程序 。 系 统 
调用 chmod 不 受 “ 新 建文 件 掩 码 ” 的 影响 。 























chmod 

目标 眉 改 京 件 的 许可 权限 和 特殊 属性 
头 文件 # include <‘sys/types, h> 

# include < sys/stat, h> 
画 数 原型 int result 一 chmod(char * path, mode t mode); 
参数 path 文件 各 

mode 新 的 许可 权限 和 特殊 饥 性 
返回 值 一 ! il Bik 

0 成 功 返 回 


OO Ee 
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(35 用 来 修改 文件 的 许可 权限 和 特殊 属性 的 命令 
Shell 命令 chmod 也 可 以 用 来 完成 上 人 述 操 作 。 它 可 以 通过 两 种 模式 指定 权限 和 属性 ,人 
进 制 模式 {如 04764) 和 符号 模式 (如 u= rws g=rw or. 


3.9.3 文件 的 链接 数 


关于 链接 数 的 详细 讨论 在 于 一 章 。 简 而 言 之 ,链接 数 就 是 文件 被 引用 的 次 数 ( 别 名 的 数 
BO. WUR .个 文件 在 日 录 树 中 一 共有 3 个 别名 ,那么 这 个 文件 的 链接 数 就 是 3。 增加 文件 
的 别名 (使 用 link) 会 使 链接 数 增加 ,减少 别名 (使 用 unlink) 会 使 链接 数 减少 。 


3.9.4 文件 所 有 者 与 组 


每 个 文件 都 有 文件 所 有 者 ,Unix 通过 用 户 TD 和 组 ID 来 标识 文件 所 有 者 和 文件 所 属 
的 组 。 

C1) 文件 所 有 者 

简单 的 说 ,文件 所 有 者 就 是 创建 文件 的 用 户 , 用 户 通过 creat 建立 文件 时 ,内 核 把 文件 所 
有 者 设 为 运行 程序 的 用 户 :如 果 程 序 具 有 set- user - ID 位 ,那么 新 文件 的 文件 所 有 者 就 是 程 
序 的 文件 所 有 者 。 

(2) 组 

通常 情况 下 ,新 文件 的 组 被 设 为 执行 创建 动作 的 用 户 所 在 的 组 ,在 有 些 情况 下 , 纽 会 被 
设 为 与 父 目录 的 组 相同 。 这 了 听 姑 来 好 像 婴 儿 的 国籍 由 出 生地 决定 而 不 由 父母 的 同 籍 来 决定 ， 

(3) 修改 文件 所 有 者 和 组 

通过 系统 调用 chown 来 修改 文件 所 有 者 和 组 : 














Chownt "filel", 200, 40); 


将 文件 file) 的 用 户 TD 改 为 200, 组 TD 27g 40, NUR i PR CR EA 1 BA C PE 
所 有 者 和 组 都 不 会 改变 。 一 般 用 户 不 大 会 修改 京 件 的 文件 所 有 者 和 组 ,但 root 经 常 出 于 管 
理 上 的 目的 要 修改 这 些 内 容 。 文 件 所 有 者 可 以 把 文件 的 组 改 成 任何 一 个 他 所 属 的 组 。 














chown 
目标 修改 文件 所 有 者 和 组 
oct # include <Uunistd. ho 
B KARE " int chown(char * path, uid t owner, gid t group) 





参数 path ”文件 省 
owner ”新 的 文件 所 有 者 ID 
group ”新 的 组 ID 

18 [e fi 一 1 38 9| SR 
0 成 功 返 回 








(4) 用 米 修改 交 件 所 有 者 和 组 的 命令 
Shell 命令 chown 和 chgrp 可 以 用 来 修改 文件 所 有 者 和 组 ， 它们 可 以 一 次 修改 多 个 文件 ， 
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可 以 用 用 户 名 /组 名 作为 参数 ,也 可 以 用 用 户 ID;/ 组 ID 作为 参数 ,关于 它们 的 详细 使 用 说 明 
参见 联机 帮助 。 


3.9.5 文件 大 小 


文件 .目录 和 命名 管道 的 大 小 是 它们 实际 所 占用 的 存储 空间 的 字 OCHO SÉ qr SC PS 
加 内 容 时 ,文件 的 大 小 会 自动 增加 ,可 以 使 用 系统 调用 creat 把 文件 的 大 小 置 为 6。 不 存在 能 
够 直接 减 小 文件 占用 的 空间 的 函数 。 


3.9.6 时 间 


每 个 文件 都 有 3 个 时 间 : 最 后 修改 (modification BT [8] ,最 后 访问 (Caecess) 时 间 和 属性 
Cn B P: BOE IP. 许 可 权限 ) 最 后 修改 时 间 , 当 文件 被 操作 时 ,内 核 会 自动 地 修改 这 些 时 间 ， 
也 可 以 编程 来 修改 最 后 修改 时 间 种 最 后 访问 时 间 。 

(1) 修改 最 后 修 收 时 间 和 最 后 访问 时 间 

utime 系统 调用 可 以 用 来 设置 最 后 修改 时 间 和 最 后 访问 时 间 ,使 用 - -个 包 会 两 个 time t 
结构 的 变量 ,一 个 time t 用 来 存放 更 新 的 最 后 修改 时 间 , 另 一 个 是 最 后 访问 时 间 ， 


























utime 

目标 修改 文件 最 后 覆 改 时 间 和 最 后 访 同时 间 

# include < sys/time, K> j 
3X xg # include «utime, h>> 

f include «sys/types. h> 
a BS i int utimetchar * path, struct uttmbuf * newtimes) 

path she 
参数 newtimes 指向 结构 变量 utimbul 的 指针 

FÉ WV, utime, h 

， 一 ! 外 到 错误 
unn 0 m 





什么 时 候 需 要 修改 这 些 时 间 呢 ? BE e c Pc B m C UE c Fs e ic fe] 和 
Ji I] FE TE] s BR € P324 OPE Be BR E IS GEH FG BS Pb IR ek EG p He] 5s RC e t o] oc HE 
就 可 以 用 utime。 恢 复 时 做 了 两 件 事 ,一 是 把 备份 的 文件 复制 回去 ,二 是 把 最 后 覆 改 时 间 和 
访问 时 间 疏 成 备份 时 候 的 情况 ,这 样 被 恢复 的 文 伴 就 与 备份 时 的 完全 一 样 。 

(2) 用 命令 修改 最 后 修改 时 间 和 最 后 访问 时 间 

shell 命令 touch 可 以 修改 文件 的 最 后 访问 时 间 和 最 后 修改 时 间 , 详 细 的 信息 参见 联机 
帮助 。 


3.9.7 文件 名 


创建 文件 时 会 指定 一 个 文件 名 ,命令 mv 可 以 政变 一 个 文件 的 名 字 , 也 可 以 把 文件 从 -一 
个 地 方 移动 到 另 一 个 地 方 。 

(OD 文件 名 的 建立 

系统 调用 creat 在 指定 文件 模式 的 同时 会 指定 文件 的 和 名字。 








^92 + Unix/Linux 编程 实 戚 教程 





(2) 修改 文件 名 
系统 调用 rename 可 以 修改 文件 /县 录 的 名 字 , 还 可 以 移动 文件 的 位 置 , 它 有 两 个 参数 ， 
基文 件 名 和 新 文件 名 。 


rename 




















目标 修改 文件 各 或 移动 文件 的 位 置 
aL ft # include ~<stdio. h> 
函数 原型 int result = rename( char * old, char * new } 
参数 old 原来 的 文件 名 或 目 录 名 

new 新 的 文件 名 或 目录 名 
返回 值 71 AB) Bik 

0 上 成功 返回 

小 结 
1. 主要 内 容 


磁盘 上 有 文件 和 目录 ,文件 和 目录 都 有 内 容 和 属性 。 文 件 的 内 容 可 以 是 任意 的 数据 ， 
上 日 录 的 内 容 只 能 是 文件 名 / 子 上 月 录 名 的 列表 。 
目录 中 的 文件 名 / 子 目 录 名 指向 文件 和 其 他 的 目录 ,内 以 提供 了 系统 调用 来 读 取 目录 
的 内 容 . 读 取 和 修改 文件 的 属性 
文件 类 型 .文件 的 访问 权限 和 特殊 属性 被 编码 存储 在 一 个 16 位 整数 中 ,可 以 通过 掩 
码 技术 来 读 取 这 些 信息 
文件 所 有 者 和 组 信息 是 以 ID 的 形式 保存 的 ,它们 与 用 户 名 和 组 名 的 联系 保存 在 
passwd 和 group 数据 库 中 ， 

2. 进一步 的 问题 

从 本 章 可 以 知道 目录 的 内 容 是 文件 各 和 目录 名 的 列 宕 ;目录 被 互相 连接 组 成 一 棵 树 , 它 
们 是 如 何 连 在 一 起 的 ? 下 一 章 会 对 目录 的 结构 做 详细 的 介绍 。 

3. 图 示 

磁盘 .目录 .文件 及 它们 的 属性 如 图 3.7 所 示 。 

di. J 

3.1 在 struct dirent 中 ,数组 d_name[] 的 长 度 在 有 的 系统 上 是 1: 而 在 有 的 系统 上 是 
255, 实 际 的 长 度 是 多 少 ? 为 什么 会 有 这 些 不 同 ? 为 什么 不 定义 成 char * 7 


* 


3.2 文件 保护 模式 ------ rwx 可 以 通过 命令 chmod 007 filename 得 到 ,虽然 这 种 做 法 
很 奇怪 ,但 却 是 合法 的 ,其 他 用 户 对 文件 有 全 部 权限 ,组 用 户 和 文件 所 有 者 都 没有 
给 任何 权限 。 对 于 这 样 的 文件 , 谁 可 以 读 ? 当 内 核 执行 open 时 ,采用 的 是 什么 忱 
辑 来 判断 是 否 可 以 执行 ? 通过 实验 来 验证 自己 的 想法 ,如 果 可 以 看 到 内 核 的 代 
码 PA 


3.3 


3.4 


3.5 


3.6 
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readdir ( ) stat ( ) 
\ 三 Th 


PP i 





目录 mm 
图 3.7 磁盘 上 有 目录 ,文件 及 它们 的 属性 


每 个 用 户 都 有 用 户 名 ,每 个 用 户 名 都 有 对 应 的 用 户 ID, 是 否 可 能 两 个 不 同 的 用 户 
名 对 应 一 个 相同 的 ID? 是 否 允许 同一 个 用 户 拥有 两 个 不 同 的 ID? 如 果 有 root 权 
限 ,可 以 试 一 试 ,创建 两 个 用 户 , 改 成 同一 个 ID, 但 有 不 同 的 用 户 名 和 密码 。 这 两 
个 用 户 是 否 可 以 修改 对 方 的 文件 ? who 输出 什么 ? Is -输出 什么 ?命令 id 输出 
什么 ? 相互 发 送 e-mail 呢 ? 从 中 能 够 看 出 些 什么 ? 多 个 用 户 使 用 同一 个 ID 还 有 
什么 其 他 用 途 ? 


与 普通 的 文件 一 样 ， 目录 也 有 特殊 属性 位 ,其 中 包含 set-user- ID 和 set- group - 
ID 位 ,使 set- user - ID 有 效 对 目录 有 什么 影响 ? 如 果 有 ,那么 是 什么 ? 为 什么 ? 
如 果 没有 影响 ,那么 你 能 想象 出 这 些 位 有 什么 作用 吗 ? 


每 个 文件 的 执行 权限 都 可 以 被 打开 或 关闭 ,假设 一 个 纯 文本 文件 具有 执行 权限 ， 
它 是 否 可 以 被 执行 ? 如 果 一 个 包含 可 执行 代码 的 文件 ,如 对 C 语言 编译 后 的 可 执 
行文 件 a. out, 没 有 执行 权限 的 话 , 它 是 否 可 以 被 执行 ? 讨论 执行 权限 和 可 执行 代 
码 之 间 的 区 别 。 它 们 之 间 有 关系 吗 ? 参见 命令 file 的 联机 帮助 。 


每 个 用 户 都 有 用 户 名 和 用 户 ID, 这 可 以 被 认为 是 两 种 标识 系统 ,为 什么 要 这 样 ? 
能 不 能 直接 用 用 户 名 来 表示 文件 所 有 者 ? 为 什么 ? 能 不 能 只 用 其 中 一 种 标识 系 
统 ? 两 套 表示 系统 有 什么 优 缺点 ? 如 果 由 你 来 设计 系统 ,你 会 如 何 设计 ? 


命令 dirent 的 联机 帮助 中 提 到 了 系统 调用 getdents(2), 它 的 功能 是 什么 ? 与 
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readdir 有 什么 关系 ? 


命令 1s-] 的 输出 中 有 这 样 一 项 drwxr-xr-xy 表 示 这 是 一 个 目录 , 它 的 文件 所 有 考 
有 全 部 权限 ,组 用 户 和 其 他 用 户 只 有 读 和 执行 的 权限 。 对 于 文件 而 言 ,执行 权限 
意味 着 计算 机 可 以 执行 其 中 包 合 的 机 器 代码 或 脚本 语句 ,对 于 目录 而 言 ,执行 权 
限 有 什么 意义 ? 可 以 用 chmod 来 美 掉 这 个 自 录 的 执行 权限 ,看 看 会 发 生 什么 。 


用 户 是 通过 终 喘 或 终端 模拟 程序 登录 到 系统 中 的 ,终端 设备 文件 位 于 /dev 目录 
下 ,输入 ls-1 /dev/tty = | more, 显 示 出 所 有 的 终端 设备 文件 的 详细 信息 ,与 普通 
文件 一 样 ,终端 设备 文件 也有 文件 所 有 者 ,就 是 在 这 个 终端 登录 的 用 户 ,无 用 户 使 
用 的 终端 设备 的 文件 所 有 者 是 root, 

终端 设备 文件 的 文件 所 有 者 被 login 程序 所 改变 ,查看 login 的 游 代码 ,找到 改变 
文件 所 有 者 的 部 分 。 当 用 户 注 销 时 ,终端 设备 的 文件 所 有 者 会 被 收 辐 成 root, 是 
娜 一 个 程序 改变 文件 所 有 者 的 ? 
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为 了 将 分 栏 输出 的 功能 加 入 到 Isl. c 中 ,观察 标准 的 的 输出 ,发 现 每 一 栏 的 宽 
度 是 由 这 一 栏 最 长 的 文件 名 决定 的 ,而 且 显 示 的 栏 数 还 受 终端 显示 器 的 宽度 影 
Wl ,每 一 列 尽 可 能 的 等 宽 。 这 是 如 何 实现 的 ? 


前 而 提 到 182. c 无 法 处 理 在 命令 行 给 出 日 录 作 为 参数 (ls2 /tmp) ,修改 182. c 使 之 
能 够 处 理 。 


修改 ls2.c, 使 之 能 够 正确 显示 文件 特殊 属性 suid.sgid 和 sticky, Z& AL XUL TIE Bh 
确保 程序 能 处 理 各 种 情况 。 


使 用 标准 的 cp 时 ,如 果 第 二 个 参数 是 目录 ,那么 会 把 第 一 个 参数 指定 的 文件 复制 
Sid nm Hx n: 

$ cpfilel /tmp 
等 价 于 ， 

$ cp filel /tmp/filel 


收 改 第 2 童 的 cpl. e 使 之 能 够 完成 上 述 工作 . 





有 时 需要 对 整个 上 月 录 作 备份 ,修改 cpl.c 使 得 当 两 个 参数 都 是 目录 时 ,把 第 一 个 
目录 中 的 所 有 文件 复制 到 第 二 个 目录 中 ,文件 名 不 变 。 


修改 Isl. c 使 得 它 能 够 将 文件 排序 后 输出 。 标 准 的 Is 支持 选项 -r, 它 的 作用 是 
逆序 输出 ,把 这 项 功能 也 加 人 到 lsl.c 中。 有 些 版 本 的 Is 支持 选项 -q, 它 的 作用 
是 不 排序 输出 , 当 目录 中 的 文件 特别 多 的 时 候 , 可 以 加 快 1s 的 输出 速度 。 


有 一 个 目录 , 它 的 许可 权限 为 rwxr -xx--x, 写 出 对 应 的 st. mode 的 二 进 制 
形式 。 











第 3 章 目录 与 文件 属性 : 编写 1s 195: 





Xd PAE TE ERB SERRE TT ERE. OR JA — EE EGIT 
开 一 个 文件 ,保持 文件 的 打开 状态 ,然后 从 另外 的 终端 登录 ,去 掉 文 件 的 读 权 限 ， 
这 时 有 什么 事情 会 发 生 ? 编写 一 个 程序 , 先 用 open() 打 开 一 个 文件 ,用 read() 读 
一 些 内 容 , 调 用 sleep(20) 等 待 20 s 以 后 ,再 读 一 些 内 容 , 从 另外 的 终端 ,在 等 待 的 
20s 内 去 掉 文 件 的 读 权 限 , 这 样 会 有 什么 结果 ? 


标准 的 1s 支持 选项 ~- 及, 它 的 功能 是 递归 地 列 出 上 县 录 中 所 有 的 文件 包 信子 目录 中 
的 文件 。 修 改 1s2. c, 使 之 支持 这 一 功能 。 


标准 的 ls 支持 选项 ~u, 它 会 显示 出 文件 的 最 后 访问 时 间 , 如 果 用 了 -u 而 不 用 - 
1 会 有 什么 结果 ? 修改 ]s2.c 使 之 支持 这 一 功能 。 提 示 : 读 -+ 选项 的 内 容 。 


自己 编写 一 个 chown, 使 之 能 够 接收 几 户 名 或 用 户 ID 作为 参数 ,能 够 一 次 修改 多 
个 文件 的 文件 所 有 者 。 考 虑 以 下 问题 ,如 何 将 文件 各 转换 为 用 户 ID? 如 果 用 户 
名 不 存在 怎么 办 ? 提示 : 要 测试 这 个 程序 ,可 能 需要 管理 员 的 权限 ， 


在 做 文件 恢复 的 时 候 , 不 仅 希望 将 文件 恢复 ,还 希望 将 文件 的 最 后 修改 时 间 和 最 
后 访问 时 间 恢 复 ,编写 cp 来 实现 上 述 要 求 。 


可 以 通过 终端 设备 文件 来 与 用 户 收发 数据 ,如 程序 从 这 个 文件 读数 据 ,就 等 于 从 
用 户 的 键盘 读数 据 , 写 数据 就 等 十 将 数据 显示 在 屏幕 上 。struct stat 中 的 成 员 变 
f st_mtime 记录 了 文件 最 后 修改 时 间 , 编 写 程序 lastdata 列 出 每 个 用 户 的 中 断 
设备 文件 的 最 后 修改 时 间 ,输出 格式 参照 who, 





6. 项 目 
根据 本 章 所 学 的 内 容 ,可 以 编写 以 下 的 Unix 程序 : 


chmod, file, chown, chgrp .finger、Louch 
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概念 与 技巧 

Unix 树 状 文件 系统 的 概念 

Unix 文件 系统 的 内 部 结构 : i- 节 点 和 数据 块 
目录 的 连接 方式 

硬 链 接 和 符号 链接 的 概念 战 相应 的 系统 调用 
pwd 的 工作 原理 

文件 系统 的 装载 (mounting) 

相关 系统 调用 


* mkdir,rmdir,chdir 
* link,unlink.rename,symlink 
相关 命令 


* pwd 


4i gm 


文件 包含 数据 ,而 月 录 是 文件 的 列表 。 不 同 的 目录 互相 连接 构成 树 状 的 结构 。 目 录 还 
AT Lita SHAY Se. EER PRET A RORY 当 登 录 到 一 台 Unix 的 机 器 上 ， 
可 以 说 你 处 在 “你 的 主 日 录 中 ”, 一 个 人 “处 在 某 个 目录 中 ”又 是 什么 意思 呢 ? 
树 状 结构 像 是 一 个 神话 。 一 个 硬盘 实际 上 是 由 一 些 金属 辆 盘 构成 的 ,每 个 盘面 上 都 有 
磁性 物质 。 这 些 金属 盘 如 何 显示 为 一 个 包含 文件 .属性 和 目录 的 树 状 结构 呢 ? 
为 回答 这 些 问题 需要 编写 自己 的 pwd 命令 。pwd 显示 你 在 日 录 树 中 的 当前 位 置 。 从 树 
根 到 你 所 处 位 置 所 经 过 的 目 订 的 序列 被 称 做 路 径 (path) 。 要 编写 pwd, 必 须 了 解 文件 和 目录 
是 如 何 组 织 和 存储 的 。 本 章 将 先 察 看 文件 系统 的 外 在 特征 . 接 下 来 分 析 它 的 内 部 结构 ,最 后 
学 习 相应 的 系统 调用 的 功能 和 使 用 方法 。 
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4.2. 从 用 户 的 角度 看 文件 系统 


4.2.1 目录 和 文件 


从 用 户 的 角度 来 看 ,Unix 系统 中 硬盘 上 的 文件 组 成 一 棵 目录 树 。 每 个 目录 能 包含 文件 
或 其 他 的 目录 。 图 4.1 是 树 的 一 个 示例 。 

下 面 将 从 构建 这 个 日 录 结 构 开 始 , 介 绍 管 
理 这 些 文件 和 目录 树 的 Unix 命令 。 


4.2.2 目录 命令 


可 以 按照 下 面 的 命令 虎 序 建立 如 图 4. 1 
Bit AS BD AR : 





demodir 








$ mkdir demodir 
5 od demodir 

$ prd 

/home/ yourname/experiments/demodir 
S mkdir b cops 

å e bg 

$ rmdir cops 

$ odg 

s mkdir dl d2 

$ ed ../,, 

$ mkdir demodir/a 


HSK BA SUR FER EUERE TRORA XB o T SUR T CE Se, 

按照 上 面 的 例子 建立 这 棵 树 。 例 子 中 使 用 了 一 些 基 本 的 命令 ,mkdir 用 来 创建 一 个 指定 
的 目录 或 多 个 目录 。 思 考 以 下 问题 ,创建 一 个 和 已 有 文件 或 目录 同名 的 目录 将 会 怎样 ? 
rmdir 用 来 删除 一 个 目录 或 多 个 目录 ,删除 一 个 包含 子 目 录 的 目录 会 发 生 什么 事 呢 ?9 mv 用 
来 重 命名 一 个 目录 ,也 可 用 来 将 一 个 且 录 从 一 个 地 方 移 到 另 一 个 地 方 。 

与 上 上 述 命令 不 同 的 是 ed 命令 不 对 目录 产生 影响 , 它 影 响 的 是 用 户 。cd 使 你 从 一 个 且 录 
转 到 另 一 个 目录 ,就 如 间 你 从 一 个 房间 走 到 另 一 个 房间 。pvwd 打印 出 当前 工作 目录 。 在 上 
面 的 例子 中 ，demoditr 是 experiments 的 一 个 子 目 录 ,而 experiments 位 于 yourname 之 下 ， 
yourname 位 于 home 之 下 ,home 位 于 根 目录 之 下 , 根 目录 用 */” 琅 示 。 


4.2.3 文件 操作 命令 
现在 在 这 棵 目录 树 中 创建 一 些 文件 : 


3 ed demodir 
$ cp /sto/group x 
$ cat x 
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root: :0 : 
bin::1;bin,daemon 
users:;200: 

$ cp x copy. of.x 

$ nv copy. oË, x y 

$ ede 

$ cp../a/z d2/xcopy 
S 1in../a/r di/xlink 
$ ls > dl/xlink 

5 cp dl/xlink z 

S rm ../../demodir/c/d2/../z 


$ cat demodir /a/x 
《想起 接着 会 显示 出 什么 ?) 


为 了 演示 各 种 文件 操作 命令 ,特意 设计 了 上 述 命 令 操作 序列 ,请 按照 上 面 的 步骤 自己 建 
立 文 件 , 想 一 下 最 后 一 个 命令 会 产生 怎样 的 结果 。 这 个 例子 中 用 了 一 些 最 常用 的 文件 处 理 
命令 。cp 用 来 复制 一 个 文件 ,在 前 面 的 章节 中 已 经 编写 了 一 个 cp 的 简易 版 本 。cat 命令 将 
文件 内 容 复制 到 标准 输出 文件 。mv 命令 可 以 重 命名 一 个 文件 ,就 像 在 第 一 个 例子 中 那样 ; 
也 可 将 文件 移动 到 另 一 个 目录 ,就 像 在 第 二 个 例子 中 那样 。rm 命令 期 除 一 个 文件 ,请 注意 目 
录 路 径 可 能 包含 ", "及 窗 个 目录 元 素 。 符 号 *,, "表示 上 一 级 日 录 , 邯 父 目 水 。 一 系列 用 单 
斜 杠 分 砚 的 目录 名 指出 了 能 到 达 指 定 对 象 的 一 条 路 经 ,注意 此 时 并 林 改 变 用 户 所 处 的 位 置 ， 
上 例 中 采用 这 种 间接 的 方法 删除 了 文件 “zx”。 




















demodir 





4,2 对 同一 文件 的 两 个 链接 


文件 的 复制 .显示 文件 的 内 容 和 重 命名 是 任何 计算 机 系统 都 会 提供 的 操作 ,市 命令 ln 则 
不 是 很 常见 ,但 它 却 是 Unix 的 一 个 基本 操作 。 如 在 上 例 中 生成 了 对 一 个 已 存在 文件 ,, /a/x 
的 一 个 链接 ,这 个 链接 称 为 di/xlink, AE 4. 2 所 示 , 称 为 x 的 项 位 于 日 录 demodir/a 中 , 称 
为 xlink 的 项 位 于 目录 demodir/c/dl 中 。x 和 xlink 都 称 为 链接 ， 一 个 链接 是 指向 文件 的 一 
个 指针 。.. /a/x 和 dl1/xlink 都 指向 硬盘 上 同一 数据 块 。 上 例 中 .下 一 个 命令 ls dl/xlink 
将 is 的 输出 作为 文件 xlink HAR. WAHI cat.. /ax 时 将 会 发 生 什 么 呢 ? 
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4.2.4 针对 目录 树 的 命令 
有 些 Unix 命令 是 对 整个 树 结构 进行 操作 ,以 下 是 一 些 例子 : 
ls -R 


ls 命令 用 来 列 出 日 录 的 内 容 , 选 项 -R 要 求 列 出 指定 目录 及 鞭子 目录 的 所 有 内 容 。 在 前 
面 的 章节 中 已 经 给 出 了 一 个 ls 的 版 本 ,但 要 完成 选项 TR 要 求 的 功能 ,还 需要 做 一 些 工 作 。 


chmod —R 


chmod 命令 几 来 修改 文件 的 许可 权限 位 ,选项 ~R 要 求 修 改 子 目录 中 所 有 文件 的 许可 
权限 。 


du 





du 是 disk usage( 硬 盘 使 用 ) 的 缩写 ,该 命令 给 出 指定 目录 及 其 子 目录 下 所 有 文件 占用 硬 
盘 中 数据 块 的 总 数 。 


find 


find 命令 将 在 一 个 日 录 及 其 所 有 子 日 录 中 检索 符合 要 求 的 文件 和 目录 。 例 如 ,可 以 检索 
— RR Ho Bp TAT 1MB, 上 周末 被 修改 过 .可 被 所 有 用 户 阅 读 的 文件 。 

Unix 中 目录 树 是 文件 系统 的 一 个 重要 组 成 部 分 ,其 他 有 很 多 命令 都 跟 目录 树 有 关 , 读 者 
可 以 自己 试 着 找 一 找 。 


4.2,5 目录 树 的 深度 几乎 没有 限制 


目录 能 够 包含 多 个 文件 和 子 自 录 。 系 统 并 未 对 目录 树 的 深度 加 以 限制 。 但 是 ,有 可 能 
所 建 的 目录 树 太 深 以 至 超过 许多 命令 允许 的 范围 。 

注意 : 如 果 你 想 尝 试 以 下 的 试验 ,请 在 自己 的 机 器 上 做 。 如 果 在 学 校 或 工作 地 点 齐 行 试 
验 , 那 里 的 系统 管理 员 肯 定 会 不 高 兴 。 

这 是 一 个 简单 的 命令 脚本 (关于 和 脚本 的 解释 详 见 第 8 BE) 


while true 

do 
mkdir deep — well 
cd deep — well 


done 


即使 你 在 程序 运行 1.2 HIRE Crrl-C, 它 也 会 创建 一 个 非常 深 的 级 联 目录 树 。 那 
^ du 命令 对 这 个 级 联 目录 会 产生 什么 效果 ? find Al ls -R 命令 又 会 如 何 呢 ? 

fr Unix 的 很 多 版 本 中 ,下 述 命 令 rm -r deep -well 将 不 起 作用 ,考虑 一 下 如 何 才能 删 
除 如 此 这 的 目录 结构 。 
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4.2.6 Unix 文件 系统 小 结 


这 个 小 节 中 从 用 户 的 角度 观察 了 Unix 的 文件 系统 。 硬 盘 上 呈现 了 一 个 能 够 在 深度 和 
宽度 上 广泛 延伸 的 目录 树 结构 ,Unix 提供 了 很 多 命令 来 和 这 种 结构 的 对 象 协同 工作 。Unix 
系统 中 的 所 有 文件 都 存在 于 这 种 结构 中 。 

它们 是 如 何 工 作 的 ? 目录 是 什么 ? 如 何 知道 文件 所 处 的 目录 ? 从 一 个 目录 转换 到 男 一 
个 目录 意味 着 什么 ? pwd 如 何 得 知 你 当前 所 处 的 位 置 ? 这 些 问 题 将 引导 下 面 的 学 习 。 


4.3 Unix 文件 系统 的 内 部 结构 


硬盘 实际 上 是 由 一 些 磁性 盘 片 组 成 的 计算 机 系统 的 一 个 设备 。 前 面 章节 中 所 提 及 的 文 
件 系统 是 对 该 设备 的 一 种 多 层次 的 抽象 。 


4.3.1 第 一 层 抽象 : 从 磁盘 到 分 区 


一 个 磁盘 能 够 存储 大 量 的 数据 。 就 像 一 个 国家 能 被 划分 成 州 或 县 ,一 个 磁盘 可 被 划分 
成 分 区 ,以 便 在 一 个 大 的 实体 内 创建 独立 的 区 域 。 每 个 分 区 都 可 以 看 作 是 一 个 独立 的 磁盘 。 


4.3.2 第 二 层 抽 和 象 : 从 磁盘 到 块 序列 


一 个 硬盘 由 一 些 磁性 盘 片 组 成 。 每 个 盘 片 的 表面 都 被 划分 为 很 多 同心 圆 ,这 些 同 心 加 
称 作 磁 道 ,每 个 磁道 又 进一步 被 划分 成 扇 区 ,就 像 郊 外 的 街道 被 划分 成 居住 单元 。 每 个 肩 区 
可 以 存储 一 定 字 节 数 的 数据 ,例如 每 个 扇 区 有 512 字 节 。 肩 区 是 磁盘 上 的 基本 存储 单元 , 现 
在 的 磁盘 包含 大 量 的 扇 区 。 图 4. 3 显示 了 序列 号 是 如 何 分 配给 磁盘 块 的 。 


给 数据 块 分 
配 编号 ， 使 
得 磁盘 看 起 
来 像 一 个 数 
组 





01234567891011... 


Bl 4.3. 为 数据 块 分 配 编号 


为 磁盘 块 编号 是 一 种 很 重要 的 方法 。 给 每 个 磁盘 块 分 配 连续 的 编号 使 得 系统 能 够 计算 
磁盘 上 的 每 个 块 。 可 以 一 个 磁盘 接 一 个 磁盘 地 从 上 到 下 给 所 有 的 块 编号 ,还 可 以 一 个 磁道 
接 一 个 磁道 地 从 外 向 里 给 所 有 的 块 编号 。 就 像 给 每 条 街道 上 的 每 所 房子 编号 一 样 ,磁盘 上 
存储 数据 的 软件 给 磁盘 上 每 条 磁道 上 的 每 个 块 分 配 了 一 个 序号 。 

一 个 将 磁盘 肩 区 编号 的 系统 使 得 我 们 可 以 把 磁盘 视 为 一 系列 块 的 组 合 。 


4.3.3 第 三 层 抽象 : 从 块 序列 到 三 个 区 域 的 划分 
文件 系统 可 以 用 来 存储 文件 内 容 、 文 件 属性 (文件 所 有 者 、 日 期 等 ) 和 目录 ,这 些 不 同类 


As 
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型 的 数据 是 如 何 存储 在 被 编号 的 磁盘 块 上 的 呢 ? 
Unix 使 用 了 一 个 简单 的 方法 。 如 图 4.4 所 示 , 它 将 这 些 磁盘 块 分 成 了 3 部 分 。 


超级 块 HAR 数据 区 
| "1 -" 
LEGE ET 


属性 存储 在 这 里 。 ”内 空 存储 在 这 里 
图 4.4 文件 系统 的 三 个 区 域 


一 部 分 称 为 数据 区 ,用 来 存放 文件 内 容 。 另 一 部 分 称 为 i- 节点 表 (inode table) ,用 来 存 
放 文件 属性 。 第 三 部 分 称 为 超级 块 (superblock) ,用 来 存放 文件 系统 本 身 的 信息 。 文 件 系统 
由 这 3 部 分 组 合 而 成 ,其 中 任 一 部 分 都 是 由 很 多 有 序 磁盘 块 组 成 的 。 

(1) 超级 块 

文件 系统 中 的 第 一 个 块 被 称 为 超级 块 。 这 个 块 存放 文件 系统 本 身 的 结构 信息 。 例 如 ， 
超级 块 记录 了 每 个 区 域 的 大 小 。 超 级 块 也 存放 未 被 使 用 的 磁盘 块 的 信息 。 不 同 版 本 Unix 
的 超级 块 的 内 容 和 结构 稍 有 不 同 , 可 以 察看 联机 帮助 和 头 文件 ,以 确定 你 的 系统 的 超级 块 所 
- 包含 的 内 容 。 

(2) i 一 节点 表 

文件 系统 的 下 一 个 部 分 被 称 为 -节点 表 。 每 个 文件 都 有 一 些 属性 ,如 大 小 ,文件 所 有 者 
和 最 近 修 改 时 间 等 。 这 些 性 质 被 记录 在 一 个 称 为 -节点 的 结构 中 。 所 有 的 i- 节点 都 有 相 
同 的 大 小 ,并 且 i- 节 点 表 是 这 些 结构 的 一 个 列表 。 文 件 系统 中 的 每 个 文件 在 该 表 中 都 有 一 
个 i- 节 点 。 如 果 你 有 root 权限 ,就 可 以 像 操 作文 件 一 样 将 分 区 打开 、 阅 读 并 显示 i- 节 点 表 。 
在 显示 utmp 文件 时 就 用 过 类 似 的 技术 。 

以 下 这 一 点 很 重要 : 表 中 的 每 个 i- 节 点 都 通过 位 置 来 标识 。 例 如 ,标识 为 2 的 i- 节点 
(inode 2) 位 于 文件 系统 i- 节点 表 中 的 第 3 个 位 置 。 

(3) 数据 区 

文件 系统 的 第 3 个 部 分 是 数据 区 。 文 件 的 内 容 保 存在 这 个 区 域 。 磁 盘 上 所 有 块 的 大 小 
都 是 一 样 的 。 如 果 文 件 包含 了 超过 一 个 块 的 内 容 , 则 文件 内 容 会 存放 在 多 个 磁盘 块 中 。 一 
个 较 大 的 文件 很 容易 分 布 在 上 千 个 独立 的 磁盘 块 中 。 那 么 ,系统 是 如 何 跟 踪 这 些 独 立 的 磁 
盘 块 呢 ? 


4.3.4 文件 系统 的 实现 : 创建 一 个 文件 的 过 程 


文件 的 内 容 和 属性 分 区 存放 的 想法 看 起 来 很 简单 ,但 实际 上 它 是 如 何 工 作 的 呢 ? 创建 
一 个 新 文件 的 时 候 又 会 发 生 什么 ? 考虑 以 下 命令 ; 


$ who > userlist 


当 这 个 命令 完成 时 ,文件 系统 中 增加 了 一 个 存放 命令 who 输出 内 容 的 新 文件 。 这 是 怎 
么 回 事 ? 
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文件 有 内 容 和 属性 ,内 核 将 文件 内 容 存 放 在 数据 区 ,文件 属性 存放 在 i- 节点 ,文件 名 存 
放 在 目录 。 图 4. 5 显示 了 创建 一 个 文件 的 例子 ,这 个 新 文件 需要 3 个 存储 块 来 存放 各 部 分 的 


数据 。 


ATTO 在 数据 块 中 存储 文件 内 容 


在 i- 节 点 中 存储 文件 信息 
存储 数据 块 序列 


CON 


文件 所 使 用 的 数据 块 列表 





增加 到 目录 的 入 口 目录 





图 4.5 文件 的 内 部 结构 


创建 一 个 新 文件 的 4 个 主要 操作 如 下 。 

(1) 存储 属性 

文件 属性 的 存储 : 内 核 先 找到 一 个 空 的 i- 节 点 。 图 4.5 中 ,内 核 找到 i- 节 点 47。 内 核 
把 文件 的 信息 记录 其 中 。 

(2) 存储 数据 

文件 内 容 的 存储 : 由 于 该 新 文件 需要 3 个 存储 磁盘 块 , 因 此 内 核 从 自由 块 的 列表 中 找 出 
3 个 自由 块 。 图 4.5 中 , 它 找到 块 627、200 和 992。 内 核 缓冲 区 的 第 一 块 数据 复制 到 块 627， 
下 一 块 数据 复制 到 块 200, 最 后 一 块 数据 复制 到 块 992。 

(3) 记录 分 配 情况 

文件 内 容 按 顺序 存放 在 块 627,200 和 992 中 。 内 核 在 i- 节 点 的 磁盘 分 布 区 记录 了 上 述 
的 块 序列 。 磁 盘 分 布 区 是 一 个 磁盘 块 序号 的 列表 ,这 3 个 编号 放 在 最 开始 的 3 个 位 置 。 

(4) 添加 文件 名 到 目录 

新 文件 的 名 字 是 userlist。Unix 如 何在 当前 的 目录 中 记录 这 个 文件 ? 答案 很 简单 。 内 
核 将 入口 (47,userlist) 添 加 到 目录 文件 。 文 件 名 和 i- 节点 号 之 间 的 对 应 关系 将 文件 名 和 文 
件 的 内 容 及 属性 连接 了 起 来 。 这 个 问题 将 在 下 面 进 一 步 地 讨论 。 


4.3.5 文件 系统 的 实现 : 目录 的 工作 过 程 


目录 是 一 种 包含 了 文件 名 字 列 表 的 特殊 文件 。 不 同 版 本 的 Unix 目录 的 内 部 结构 不 同 ， 
但 是 它们 的 抽象 模型 总 是 一 致 的 一 一 一 个 包含 -节点 号 和 文件 名 的 表 。 
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i-as 文 性 名 
2342 | 
43989 .. 
3421 hello, c 
533870 inyls. c 





CD 探讨 日 录 内 部 
可 以 通过 命令 ls -1iat 选 项 第 一 位 是 数字 1) 来 看 目录 的 内 容 : 


$ ls - lia demodir 
177865. 

529193.. 

588277 a 

200520 c 

204491 y 

$ 


输出 的 是 文件 省 和 对 应 的 i- 节点 号 。 例 如 ,文件 各 y 对 应 于 i- 节点 导 204491。 当 前 目 
录用 “表示 ,i 节点 号 是 177865。 这 意味 着 有 关 太 小 ,文件 所 有 者 、 组 等 各 项 关于 当前 目录 
的 信息 存放 在 i- 节 点 表 中 的 编号 为 177865 的 结构 中 。 

ls 的 选项 -i 和 -1( 数 字 1 而 不 是 字母 |) 可 能 有 点 陌生 。 选 项 -i 告诉 1s 在 列表 中 包含 i 
- 节 氮 号 ,选项 -1 要 求 每 行列 出 一 个 文件 ,在 demodir 版 本 上 尝试 这 个 命令 ,以 查看 所 得 到 
的 i- 节点 号 。 

(2) 指向 同一 文件 的 多 重 链 接 

可 以 使 用 命令 1s -i 查看 系统 上 任何 一 个 文件 的 -节点 号 。 例 如 ,可 以 查看 系统 上 根 且 
录 中 各 文件 的 i- 节点 号 ; 


5 ls -ia/ 
2. 28673 etc 11 lost + found 438292 shlib 
2 .. 311297 home 4097 mnt 40961 tmp 
i auto 8832  home2 108545 opt 18433 usr 
26625 bin 24646 initrd 1 proc 10241 var 
403457 boot 24578 install 24681 root ` 183 xfer, log 
225281 dev 161797 lib 233473 sbin 183 transfers 


这 个 列表 含有 两 个 重要 的 例子 。 第 一 ,在 右 下 角 有 被 称 为 xfer log 和 transfers 的 两 个 
文件 。 这 两 个 文件 都 拥有 i- 节 点 号 183。 因 此 ,两 个 文件 都 指向 同一 个 i- 节点 。i- 节 点 实 
际 上 代表 了 一 个 文件 ,i- 节点 包含 了 文件 的 属性 和 数据 块 的 列表 。 因 此 , xfer. log 和 
transfers 是 同 -- 个 文件 的 两 个 不 同名 字 。 这 有 点 像 电 话 德里 的 两 个 不 同 的 电话 号 码 所 对 应 
的 电话 机 有 可 能 在 同一 所 房子 ?。 








外 ”电话 短 的 比喻 不 是 完全 恰当 ,内 为 两 个 木 同 的 人 部 可 能 住 在 那个 房子 。 请 在 网 络 编 释 章 匠 中 了解 port 的 概念 。 
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在 根 目 录 中 另 一 个 重要 的 例子 是 左上 角 的 “. ”和 “.. ”这 两 项 都 有 i 一 节点 号 2, 所 以 “.” 
gr^. "都 指向 同一 个 目录 。 当 前 目录 怎么 会 和 父 目录 相同 呢 ?? 实际 上 在 大 多 数 情 况 下 , 它 
们 是 不 同 的 , 根 目 录 比 较 特别 , 当 用 Unix 命令 mkfs 创建 了 一 个 文件 系统 ,mkfs 将 根 目 录 的 
父 目 录 指 向 自己 。 


4.3.6 文件 系统 的 实现 : cat 命令 的 工作 原理 

现在 已 经 看 到 了 创建 一 个 新 的 文件 时 内 部 所 发 生 的 事情 ,例如 who > userlist. 当 读 取 
一 个 文件 时 又 会 发 生 什 么 呢 ? 读 取 命 令 如 何 工 作 ? 对 如 下 的 命令 : 

$ cat userlist 


采用 从 目录 文件 一 步 一 步 找 到 数据 的 方法 来 加 以 了 解 。 

(1) 在 目录 中 寻找 文件 名 

文件 名 存储 在 目录 文件 中 。 内 核 在 目录 文件 中 寻找 包含 字符 串 userlist 的 记录 。 
userlist 所 在 的 记录 包含 编号 为 47 的 i- 节点 号 ,如 图 4.6 所 示 。 


$ cat userlist 


从 文件 名 到 文件 内 容 : 
在 目录 中 寻找 文件 名 
使 用 编号 定位 -节点 
i- 节 点 包含 数据 块 的 


列表 








4.6 从 文件 名 到 磁盘 块 


(2) 定位 i- 节 点 47 并 读 取 其 内 容 . 

内 核 在 文件 系统 中 的 i- 节点 区 域 找到 i- 节点 47。 定 位 一 个 i75 ex RT RETE 9E — 2e fl] HR. 
的 计算 ,所 有 的 i- 节点 大 小 相同 ,每 个 磁盘 块 都 包含 相同 数量 的 i- 节 点。 为 了 提高 访问 效 
率 ,内 核 有 可 能 将 i- 节 点 置 于 缓冲 区 中 。i- 节 点 包含 数据 块 编号 的 列表 。 

(3) 访问 存储 文件 内 容 的 数据 块 

通过 以 上 过 程 ,内 核 已 经 可 以 知道 文件 内 容 存 放 在 哪些 数据 块 上 ,以 及 它们 的 顺序 。 由 
于 cat 不 断 地 调用 read 函数 ,使 得 内 核 不 断 将 字 节 从 磁盘 复制 到 内 核 缓 冲 区 ,进而 到 达 用 户 
空间 。 

所 有 从 文件 读 取 数据 的 命令 ,例如 cat, cp. more, who 等 ,都 是 将 文件 名 传 给 open 来 访 


(D 参考 Latham & Jaffe 编著 的 Im My Own Grandpa, 1947 对 相关 主题 的 讨论 。 
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问 文件 内 容 。 对 open 的 每 次 调用 都 是 先 在 目录 中 寻找 文件 名 ,然后 根据 目录 中 的 i- 节 点 号 
获得 文件 的 属性 ,最 终 找 到 文件 的 内 容 。 

现在 可 以 想象 一 下 在 open 一 个 没有 读 或 写 权 限 的 文件 时 将 发 生 什么 情况 。 内 核 首先 根 
据 文件 名 找到 i- 节 点 号 ,然后 根据 i- 节 点 号 找到 i- 节点 。 在 i- 节点 中 ,内 核 找 到 文件 的 权 
限 位 和 拥有 者 的 用 户 ID。 如 果 权 限 位 设置 你 的 用 户 TD 对 文件 没有 访问 权限 , 则 open 返回 
一 1 并 且 将 全 局 变量 errno 的 值 设 为 EPERM, 

通过 对 目录 \i- 节 点 和 数据 块 的 描述 ,相信 能 提高 对 其 他 的 文件 操作 的 理解 。 可 以 通过 
阅读 一 些 版 本 的 Unix 系统 源 代码 来 加 以 检验 。 


4.3.7 i 一 节点 和 大 文件 


Unix 文件 系统 如 何 跟 踪 大 文件 呢 ? 其 实 前 一 个 章节 中 的 解释 并 不 完整 。 简 短 地 说 , 问 
题 是 : 


事实 1 。 一 个 大 的 文件 需要 多 个 磁盘 块 
事实 2 ”在 i- 节 点 中 存放 有 磁盘 块 分 配 列表 
问题 。 一 个 固定 大 小 的 i- 节点 如 何 存储 较 长 的 分 配 列表 ? 
解决 方案 ”将 分 配 列表 的 大 部 分 存储 在 数据 块 ,在 i- 节点 中 存放 指向 那些 块 的 指针 。 
考虑 图 4.7 中 描述 的 解决 方案 。 这 个 文件 需要 14 个 数据 块 存储 它 的 内 容 。 因 此 ,分 配 
链表 包含 14 个 块 的 编号 。 但 是 很 遗憾 ,文件 的 i- 节点 只 包含 一 个 含有 13 个 项 的 分 配 链表 。 
14 个 编号 如 何 放 到 13 个 项 中 呢 ? 其 实 很 简单 。 将 分 配 链表 中 的 前 10 个 编号 放 到 i- 节点 
中 ,将 最 后 4 个 编号 放 到 一 个 数据 块 中 。 这 有 点 像 把 某 些 货物 放 在 架子 上 而 把 剩 下 的 放 在 仓 
库 里 。 
更 具体 地 说 ,就 是 该 i- 节点 的 链表 包含 分 配 13 个 块 编号 的 空间 ,链表 里 的 前 10 个 项 像 






这 节点 





块 13 存 储 着 包 
含 更 多 二 级 间 
接 块 的 那个 块 
的 编号 。 这 个 

ii 块 被 称 做 三 级 
分 配 列表 从 i- 节 ”分 配 列表 在 间接 。 块 12 存 储 着 包含 更 多 "UR. 
点 列表 中 的 前 10 块 中 继续 。 块 11 ”间接 块 的 那个 数据 块 
个 块 开始 。 存储 着 那个 块 的 。 的 编号 。 这 个 块 被 称 

编号 。 做 二 级 间接 块 。 





4.7 在 数据 区 延伸 的 块 分 配 列表 
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“架子 空间 ”一 在 那 106 PT PMR SOE RENE. dn RA BOSE ST 
10 个 的 项 , 则 剩 下 的 块 编 中 不 是 存储 在 i- 节 点 ,而 是 存储 在 数据 区 。 存 放 多 余 编 号 的 数据 
块 的 编号 存储 在 i~ 节 点 的 第 11 个 项 中 一 一 就 像 书 店 里 有 个 使 条 贴 在 架子 上 写 着 “ 刹 下 的 货 
物 在 仓库 的 3 号 架子 上 ”。 

注意 到 这 个 文件 实际 上 用 了 15 个 数据 块 。 其 中 14 SADR FEE BUR B9 17 
存放 着 i- FT RS SBE FO EB BB oP AE, A A Da Bi Oh TT ER 

CO [B] BEER a A ENT Br fup Ab BB? 

2 BER BS HO 5 BS AU AO ot HER A BO ROR A, 
需要 更 多 的 存储 空间 。 SP AC BEG Ax Fe ER A A 8S] AE OCA, 
A BORE 20 fo] RETE PR eS? AREA PER EE BA i- 节点 的 第 12 
个 项 中 吗 ? BVA A ERA BOCES A 3 个 额外 抉 。 实 际 上 ,内 核 并 不 把 第 
二 个 额外 块 的 编号 放 人 1 一 千 点 ,取而代之 的 晨 , 内 核 半 辟 另外 一 个 块 来 存放 这 些 额外 间接 块 
AFRE. i 一 节点 的 第 12 项 并 不 存放 第 二 个 额外 块 的 编号 ,而 是 存放 那个 存储 着 第 2.3、4 太 
后 继 铬 外 块 的 编号 的 块 的 编号 。 这 个 块 被 称 为 二 级 间接 块 ， 

(2) 二 级 间接 块 饱 和 寺 如 和 何 处 理 ? 

当 二 级 间接 块 饱和 时 ,内 核 开辟 另 一 个 新 的 二 级 间接 块 。 内 核 并 不 把 这 个 新 的 间接 二 
级 其 的 编号 放 人 节点 的 列表 。 而 是 创建 一 个 三 级 问 接 块 来 存放 二 级 间接 块 的 编导 以 及 这 
个 文件 将 来 所 需要 的 所 有 间接 二 级 块 的 编号 。i-- 节 点 列表 的 最 后 一 项 正 是 记录 着 这 个 三 级 
间接 块 的 编号 。 

(3) 二 级 间接 块 饱 和 时 又 将 如 何 钼 理 ? 

文件 到 达 了 极限 。 如 果真 想 使 用 大 文件 ,可 以 创建 一 个 由 更 大 的 磁盘 块 构 成 的 文件 系 
统 。 当 创建 该 文件 系统 时 ,不 仅 能 够 定义 i- 节 点 表 和 数据 区 的 天 小 ,而 且 能 够 定义 磁盘 块 的 
大 小 。 磁 盘 块 并 不 需要 和 磁盘 主 区 同样 大 小 ,通常 一 个 磁盘 块 包 售 若干 个 大 区 。 

由 于 大 文件 的 存储 管理 需要 更 多 的 开销 ,因此 这 样 的 磁盘 分 配 系 统 对 小 文件 来 说 是 快 
捷 高 效 的 。 当 文件 逐步 增长 时 ,内 核 使 用 更 多 的 磁盘 空间 去 维护 越 米 越 长 的 分 配 烈 表 。 在 
文件 中 定位 一 个 特定 的 位 置 可 能 需要 获取 若干 个 间接 块 以 得 到 数据 块 的 编号 。 


4.3.8 Unix 文件 系统 的 改进 


前 一 小 节 描 述 了 Unix 文件 系统 的 结构 。 不 同 版 本 的 Unix 使 用 这 种 模型 的 不 同 版 本 。 
这 个 经 典 的 简洁 方法 有 些 严重 的 不 足 之 处 。 鲍 如 ,超级 块 就 是 一 个 问题 。 如 果 这 个 所 损坏 
了 ，, 则 整个 文件 铸 统 的 结构 信息 就 没有 了 ,新 版 本 的 Unix 在 文件 系统 中 备份 了 这 个 块 的 
副本 。 

分 块 是 男 一 个 问题 。 由 二 文件 的 创建 和 删除 ,自由 块 将 遍布 磁 委 。 一 种 方案 是 在 文件 
系统 中 创建 被 称 为 柱 面 组 (ecylinder group) MICE B. 

但 是 这 个 经 典 的 模型 并 末 过 时 。 文 件 仍 由 存储 在 数据 区 的 块 中 ,文件 属性 仍旧 存储 在 i 
-市 点 表 中 的 i- PAT i TRS BRAM: 目录 仅 是 文件 各 和 i -节点 号 的 列 
表 。 现 在 再 来 回顾 一 下 在 前 面 - : 章 中 所 创建 和 探讨 的 目 法 树 。 在 理解 J 文件 系统 的 内 部 结 
构 以 后 ,再 看 目录 利文 件 的 结构 就 很 清楚 了 。 
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4.4 理解 日 录 


在 了 解 了 一 个 Unix 文件 系统 的 目录 结构 之 后 ,就 能 够 知道 日 录 树 究竟 是 怎么 四 事 ,并 
且 能 够 理解 不 同 的 日 录 命 令 是 如 何 工作 的 。 


4.4.1 理解 目录 结构 


用 户 看 到 的 文件 系统 是 目录 和 子 目 录 的 集合 。 每 个 日 录 能 够 包含 交 件 和 子 目 录 , 每 个 
于 莫 录 有 一 个 父 目 录 , 这 标 酝 的 结 购 常用 线条 连接 的 力 块 图 来 表示 。 文 件 在 一 个 日 录 中 是 
什么 意思 ? 专业 术语 “dl EÈ c 的 一 个 子 月 录 ” 及 是 什么 意思 ?图 上 的 线条 代表 什么 意思 ? 

在 文件 系统 内 部 ,目录 是 一 个 包含 文件 名 与 i- 节 点 对 的 列表 的 文件 。 从 用 户 的 角度 看 
到 的 是 个 文件 名 的 列表 , 面 从 Unix 的 钊 度 看 到 的 是 一 个 被 命名 的 指针 的 列表 ,如 图 4.8 
BUR. 





用 户 角度 系统 角度 


== 
Jf 
HE 
. 1] 
-- | 
[ — | xeopy | 


图 4.8 目录 树 的 丙种 不 同 视图 








i=" 
bat 


如 何 从 用 户 的 角度 转换 到 系统 的 角度 ? 通过 在 图 中 添加 i- 节 点 号 ， 就 能 够 了 解 日 录 树 
是 如 何 连接 在 一 起 的 。 使 用 1s -iaR 可 以 列 出 一 棵 树 中 的 所 有 文件 的 i- 节 点 号 。 


$ ls - iaR demodir 


865 , 183 e. 277 a 520 c 481 y 
demodir/a;: 

277 . 865 i. 402 x 

demodir/c. 

520 . 865 e. 651 di 247 d2 
demodir/c/dl: 

$51 . 520 m 402 xlink 


demodir/c/d2; 
247 . 520 " 680 xcopy 
$ 
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图 4.9 是 上 例 的 图 示 。 


用 户 角 度 系统 角度 


i | 
[S65 | 
402 [x — | 





图 4.9 文件 名 和 指向 文件 的 指针 


(1)“ 文 件 在 目录 中 ”的 真正 含义 

一 般 都 说 文件 存放 在 某 个 目录 中 ,但 是 现在 已 经 知道 目录 中 存放 的 只 是 文件 在 i- 节点 
表 的 人 口 ,而 文件 的 内 容 则 存储 在 数据 区 。 文 件 在 某 个 目录 中 是 什么 意思 ? 例如 ,从 用 户 的 
角度 来 看 ,文件 y 在 目录 demodir 中 ,而 从 系统 角度 来 看 ,看 到 的 则 是 目录 中 有 一 个 包含 文件 
名 y 和 i- 节 点 号 为 491 的 入 口 。 

类 似 地 , “文件 x 在 目录 a 中 ”意味 着 在 目录 a 中 有 一 个 指向 i- 节点 402 的 链接 ,这 个 链 
接 所 附加 的 文件 名 为 x。 注 意 ,这 一 点 很 重要 ,在 左 端 较 低 处 标 为 dl 的 目录 包含 一 个 指向 i 
-节点 402 的 链接 ,那个 链接 被 称 为 xlink。 称 为 demodir/a/x 的 链接 和 称 为 demodir/c/d1/ 
xlink 的 链接 指向 同一 个 文件 。 

简短 地 说 ,目录 包含 的 是 文件 的 引用 ,每 个 引用 被 称 为 链接 。 文 件 的 内 容 存 储 在 数据 
块 ,文件 的 属性 被 记录 在 一 个 被 称 为 i- 节 点 的 结构 中 ,i- 节 点 的 编号 和 文件 名 存储 在 目录 
中 “目录 包含 子 目录 ”的 原理 与 此 相同 。 

(2)“ 目 录 包 含 子 目录 ”的 真正 含义 

从 用 户 的 角度 来 看 ,目录 a 是 目录 demodir 的 一 个 子 目录 ,那么 在 系统 内 部 究 况 是 如 何 
运作 的 呢 ? 实际 上 demodir 包含 一 个 指向 那个 子 目录 i- 节点 的 链接 。 从 系统 角度 来 看 ,最 
上 面 一 个 表 包 含 一 个 指向 i- 节点 277 的 链接 , 称 为 a。 如 何 知道 277 是 左边 那个 目录 的 i- 
节点 号 呢 ? 每 个 目录 都 有 一 个 i- 节 点 ,内 核 在 每 个 目录 都 设置 一 个 指向 目录 本 身 的 ii 节点 
HAD; 这 个 人 口 被 称 为 “.”。 在 左边 的 小 方 框 中 ,点 表示 i- 节 点 277, 因 此 左边 的 目录 表示 
i 一 节点 277, 

如 图 4. 10 所 示 ,i- 节 点 520 的 目录 是 如 何 被 包含 在 demodir 中 的 , 它 在 目录 demodir 中 
的 名 字 被 标识 为 c。 类 似 地 ,i- 节 点 247 是 另 一 个 目录 ,名 字 为 d2, 它 是 i- 节 点 520 的 一 个 














第 4 章 文件 系统 : 编写 pwd * 108 * 








TH. 


用 广角 度 系统 角度 
demodlr 
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[320 [:* | 


图 4.10 目录 名 和 指向 目录 的 指针 


(3) "Hg S—T ZH" MAES X 

从 用 户 的 角度 看 目录 d CHAREE c。 这 里 再 次 用 一 个 指向 i- 节 点 的 简单 链接 实 
MEHR c fg i- TREA 520. HR 2 包含 一 个 称 为 “.. ”的 入 口 。 这 个 入 口 的 i- 节 点 号 是 
520。“.. ”是 父 目录 的 保留 名 字 。 轩 此 ,i 节点 520 是 -节点 247 的 父 节点 。 

(4) 填充 空白 的 i- 节 点 号 

如 果 理 解 了 前 面 的 章节 , 接 下 来 就 能 够 填充 图 4. 10 中 的 空余 的 -节点 号 。 如 果 不 知 首 
这 些 空白 处 该 填 什 么 ,可 以 查看 一 下 ls 的 输出 内 容 并 复习 一 下 前 面 章节 的 内 容 ， 

(5) 多重 链接 及 链接 数 

在 demodir 目录 树 中 ,i- 节 点 402 有 两 个 链接 。 一 个 是 在 目录 a 中 , 称 为 x, 另 一 个 在 目 
录 由 中 , 称 为 xlink。 那 么 哪个 是 原始 文件 ? 刀 个 是 指向 它 的 链接 呢 ? 在 Unix 的 目录 结构 
中 ,这 商 个 链接 的 状态 完全 相同 ; 它们 被 称 为 指向 文件 的 硬 链接 。 文 件 是 一 个 i- 节 点 和 一 
些 数据 块 的 结合 ; 链接 是 对 i- 节 点 的 引用 。 可 以 对 一 个 文件 创建 任意 多 的 链接 。 

内 核 记录 了 一 个 文件 的 链接 数 。 就 ij- 节点 402 来 说 ,链接 数 至 少 是 2。 因 为 在 文件 系统 
的 其 他 部 分 或 许 还 存在 着 -节点 402 的 其 他 链接 。 链 接 数 被 记录 在 i- 节 点 中 ,同时 是 系统 
调用 stat JK EMA stat 结构 中 的 一 个 成 员 。 

(6) 文件 名 

在 Unix 的 文件 系统 中 ,文件 没有 文件 名 ,但 是 链接 具有 名 字 。 文 件 仅 仅 拥有 -节点 导 。 
在 后 面 的 章节 中 ,可 看 到 这 种 方法 的 便利 之 处 。 


44.2 与 目录 树 相关 的 命令 和 系统 调用 


Unix 文 件 系统 的 内 部 结构 比较 简单 ,仅仅 是 一 些 相互 链接 的 数据 结构 。 节 点 被 称 为 i- 
节点 ,指针 的 集合 被 称 为 目录 ,叶子 节点 被 称 为 链接 。 通 过 标准 的 Unix 命令 来 对 这 个 树 状 结 
构 进 行 管 理 , 例 如 mkdir rmdir, mv, in 和 rm 等 。 这 些 命令 是 如 何 工 作 的 呢 ? 它们 将 使 用 哪 
些 相关 的 系统 调用 呢 ? 
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(1) mkdir 
命令 mkdir 用 来 创建 新 的 日 录 。 它 接受 命令 行 上 的 一 个 或 多 个 目录 名 ,使 用 mkdir 系统 
调用 : 








mkdir 





Be BETTE! ] 
AME # include «sys/stat, hz» 
# include «sys/types, hi 

















函数 原型 int result 一 mkdir(char * pathname, mode t mode) 
$e pathname ”新 目录 名 
| mode 权限 位 的 掩 码 
返回 值 —] 8 s grim 
Q 成 功 创建 





mkdir 创建 一 个 新 的 日 录 节 点 并 把 它 链 接 至 文件 系统 树 。 即 mkdir 创建 了 这 个 目 孙 的 i 
-节点 ; 分 配 了 一 个 磁盘 块 用 以 存储 它 的 内 容 ; ERS PR BRP A: * RY. EE 
KATEN i- HAr: 在 它 的 父 日 录 中 增加 一 个 该 节点 的 链接 。 

(2) rmdir | 

命令 rmdir 用 来 出 除 一 个 目录 。 它 接受 命令 行 上 一 个 或 多 个 目录 名 ,使 用 rmdir 系统 
调用 : 




















rmdir 
目标 | BRO TER. MO EDS S 
头 文件 # include < unistd. h 
EESTE i — int result = rmdir (const char * path}; 
参数 Path 目录 名 
i [pl dir 一 1 遇 到 错误 
9 HE T a Be 





rmdir 从 目录 树 中 圳 除 一 个 目录 节点 。 这 个 月 录 必 须 是 空 的 。 即 除了 ".*” 和 “..” 的 入 
[1 ,这 个 生 录 不 能 包含 其 他 任何 的 文件 和 子 目录 .。 同时 在 父 目录 中 删除 这 个 自 录 的 链接 ， 
如 时 这 个 目录 本 身 并 未 被 其 他 的 进程 占用 , 它 的 i- 节点 和 数据 鼎 将 被 释放 。 

(3) rm 

命令 rm 用 来 从 -一 个 目录 文件 中 册 除 ~- 个 记录 , 它 接受 命令 行 上 一 个 或 多 个 文件 名 ,使 
用 unlink 系统 调用 : 























unlink 
目标 删除 -个 链接 
MF i # include < unistd. hi> 
函数 原型 int result = unlink (const char * path); 
参数 path 。 需 删除 的 链接 名 
返回 入 一 】 iB BBR 
Ü 成 功 删除 


一 一 一 一 一- MR 
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unlink 用 来 删除 目录 文件 中 的 一 个 记录 ,减少 相应 i 一 节点 的 链接 数 。 如果 该 1- 节点 的 
链接 数 减 为 0, 数 据 块 和 i 节点 将 被 释放 。 如 虚 该 i- 节 点 有 其 他 的 链接 , 则 数据 块 和 i 一 节点 
EAR SEG Hi]. unlink 不 能 被 用 来 删除 日 录 。 

(42 In 

命令 In 用 来 创建 一 个 文件 的 链接 ,使 用 系统 调用 link: 




















link 

Ae 创建 :个 文件 的 新 链接 
iE # include < unistd, h> 
函数 原型 int result = link (const char * orig, const char * new); 
参数 orig 原始 链接 的 名 字 

new 新 建 链接 的 名 字 
返回 信 —138 5g 

o 成 功 创建 





link 生成 一 个 1- 节点 的 链接 。 新 链接 包含 原始 链接 的 1- 节点 号 并 且 具 有 特定 的 名 字 。 
如 果 已 经 存在 一 个 和 新 链接 名 相同 的 链接 , 则 link 将 失败 。link 不 能 被 用 来 生成 目录 的 新 链 
接 。 





(5) mv 
命令 my 用 来 改变 文件 和 月 录 的 名字 或 位 置 , 是 这 小 节 中 所 讲述 的 最 为 灵活 的 一 个 命 
令 。 在 很 多 情况 下 ,mv 仅仅 使 用 系统 调用 rename; 





rename 

















目标 重 命名 或 删除 一 个 链接 
abe e + include <Cunistd, h> 
eR Eg m mU int result = rename (const char « from, const char ta); 
参数 from 原始 链接 的 名 字 
to 新 建 链接 的 名 字 
返回 值 —i 过 到 错误 
0 成 功 返 回 





rename 用 来 改变 文件 或 目录 的 和 名字 或 位 置 。 例 如 ,renamed "y", "y, old") Hi di AB xc 
件 的 名 字 ,而 rename("y", "c/d2/y. old") 用 来 改变 文件 的 名 字 和 位 置 。rename 适用 于 文件 
税目 录 ,; 但 是 在 进行 目录 移动 时 有 些 限制 。 例 如 ,不 能 将 一 个 目录 移动 到 它 的 子 和 目录 中 去 。 
考虑 一 下 rename( "demodir/c". "demodir/d2/c') 将 会 产生 怎样 的 后 果 。 和 和 ink 不 同 ， 
rename 将 删除 第 一 个 参数 所 指定 的 已 存在 的 文件 或 空 目录 ， 

rename 是 如 何 将 一 个 文件 移动 到 另 一 个 目录 的 蛇 ? 文件 实际 上 并 不 存在 于 目录 中 , 目 
录 中 存放 的 仅仅 是 它 的 链接 。 因 此 ,rename 将 链接 从 一 个 目录 移动 到 另 一 个 目录 。 将 目录 
y 移动 到 c/d2/y. old 看 起 来 就 像 图 4. 11 Br. 
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在 rename 执 行 之 前 rename (“y”*c/di/y.old" ) 执 行 之 后 


[865 [|. — ] 
1.193] | 
277|a | 
L520[c — ] 


by [520]- — | 
[865 |-- —] -TH 一 
[402 [x] 237143 






Py A — 1] 
[865 |-- — | 
1402 |X — | 





Ch"! par SEE 
[一 一 
[a02 [xlink] | L680]Xc95y] ne f$ 





图 4.11 一 将 文件 移动 到 新 的 目录 - 


首先 ,在 demodir 中 存在 着 一 个 指向 i- 节点 491 的 链接 , 称 为 y。 然后 ,一 个 称 为 y. old 
的 指向 记 节 点 的 链接 出 现在 c/d2 中 ,而 原来 的 链接 消失 了 。 内 核 是 如 何 移动 这 些 链 接 的 呢 ? 

在 Linux 内 核 ,rename 的 基本 逻辑 是 

: 复制 链接 至 新 的 名 字 / 位 置 

。 删除 原来 的 链接 

Unix 提供 系统 调用 link 和 unlink 完成 这 两 个 操作 。 因此 ,rename("x"，"z") 是 这 样 运 
1E RU: 


if ( link("x", "g") 1= —1) 
unlink("x"); 


实际 上 ,过 去 没有 rename 这 个 系统 调用 ,因此 命令 mv 使 用 系统 调用 link 和 tinlink。 在 
内 核 中 增加 系统 调用 rename 解决 了 两 个 问题 。 普 先 ,rename 使 得 重 命名 或 重 定 位 一 个 目录 
变 得 更 加 安全 。 过 去 ,一 般 的 用 户 不 能 对 目录 进行 link 或 unlink 操作 ,因此 他 们 没有 办 法 重 
命名 一 个 目录 

男 一 个 使 用 rename 的 优点 是 支持 非 Unix 文件 系统 。 在 Unix 中 , 重 命名 一 个 文件 或 目 
录 是 通过 改变 链接 完成 的 ,但 是 其 他 的 系统 可 能 不 按 这 种 方式 工作 。 将 通用 方法 rename 添 
加 至 内 核 隐藏 了 实现 的 细节 ,使 得 相同 的 代码 能 够 在 各 种 文件 系统 上 运行 。 

(6) cd 

cd 用 来 改变 进程 的 当前 目录 。cd 对 进程 产生 影响 ,但 是 并 不 影响 目录 。 一 个 用 户 可 能 
会 说 ;“ 我 进入 了 /tmp 目录 ,发 现 一 大 堆 的 垃圾 文件 ”, 而 另 一 个 用 户 可 能 会 说 :“ 我 进入 了 阁 
楼 ,发 现 了 很 多 旧书 ”。cd 使 用 系统 调用 chdir: 
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ehdir 
目标 改变 所 调用 进程 的 当前 目录 
KEE Hinclude «Zunistd. ho ` 
T 函数 原型 int result = chdir (const char * path); 
参数 path ”要 到 达 的 目录 
返回 值 —1 BEHR 
9 ROBE . 





Unix 上 的 每 个 运行 程序 都 有 一 个 当前 目录 ,chdir 系统 调用 改变 进程 的 当前 目录 。 在 系 
统 内 部 ,进程 有 一 个 存放 当前 目录 i- 节点 号 的 变量 。 从 一 个 目录 进入 另 一 个 目录 只 是 改变 
那个 变量 的 值 。 

TE cd.. 如 何 工作 。 使 用 demodir 这 个 合子 ,假设 现在 位 于 一 个 称 为 的 目录 ,那么 , 当 
前 目录 的 i- 节 点 号 是 多 少 ? 如 现在 输入 cd d1, 则 当前 目录 的 i- 节 点 号 是 多 少 ? 内 核 是 如 何 
获得 这 个 值 的 呢 ? 如 果 随 后 输入 cd . ./.. , 则 当前 目录 的 i- 节 点 号 又 是 多 少 ? 内核 使 用 了 
什么 步 又 获得 该 1- 节点 号 ? 

如 果 知道 如 何 完成 这 个 重要 的 练习 ,那么 已 经 明白 命令 pwd 是 如 何 工 作 的 了 。 


4.5 dà 写 pwd 


命令 pwd 用 来 显示 到 达 当 前 目录 的 路 径 。 例 如 ,如 果 位 于 demodir/c/d2 并 且 输 入 
pwd, BE AT Li wy Bl 


$ pwd 
{home /yourname/exper iments /demodir/e/d2 


这 么 长 的 路 径 存 放 在 哪里 呢 ? 其 实 它 并 不 位 于 当前 的 目录 中 。 当 前 目录 称呼 本 身 为 
“ ”并且 有 一 个 i- 节点 号 。 目 录 仅 是 相互 连接 的 节点 集合 中 的 一 个 节点 pwd 如 何 知道 该 
HRE c2,c2 MH RE eye 的 父 日 录 是 demodir W? : 


4.5.1 pwd 的 工作 过 程 


就 像 本 章 中 所 有 问题 的 答案 一 样 ,这 个 问题 的 答案 也 是 简单 的 , 追踪 链接 , 读 取 目录 ,一 
个 目录 接着 一 个 月 录 地 沿 着 树 向 上 追踪 ,每 步 查 看 “, ”的 1- 节点 号 ,然后 在 父 目录 中 查找 该 i 
-节点 的 名 字 , 直 到 到 达 树 的 顶端 。 如 图 4. 12 所 示 。 

从 当前 日 录 ( 就 是 右 下 角 的 那个 目录 ) 开 始 上 加 。 在 该 目录 当中 ,所 处 位 置 的 名 称 为 
“… 拥有 ii 节点 号 247。 现 在 利用 chdir 向 上 到 达 父 目录 ,查找 含有 ji -节点 247 的 人 口 。 在 
父 目录 中 ,i 一 节点 247 称 为 42。 因 此 ,路 径 的 最 后 一 项 是 d2。 父 日 录 的 名 字 是 什么 呢 ? 在 父 
自 录 中 , 它 的 名 字 是 “, ”拥有 IUS 520。 通 过 chdir 进 人 它 的 父 目录 ,可 以 看 到 j- 节 点 
520 和 名字 为 <。 因 此, 路径 的 最 后 两 项 是 c/d. BERUF 3 个 步骤 的 重复 。 








| 114 œ Unix/Linux 编程 实践 教程 





6 1 UR 247 
EHON 5 chair, . 
EHER 2. 247 dig" dz" 
chair. . 
[320]. — ]3 4. 520 BHH" 
E 全 二 一 5. "EE 865 
[402 [x | reel tot 2 chair, . 
6. 865 BR“ demodir" 
chair, . 
— BESGUÉe 
402 [fink ] Peso (xcopy; ehair.. 


图 4.12 计算 当前 路 径 


(1) f8 Sj". "的 1 节点 号 , 称 其 为 n( 使 用 stat) 。 

(2) chdir. . (使 用 chdir). 

(3) 找到 i~- 节 点 号 x 链接 的 名 字 ( 使 用 opendir.readdir.closedir), 

重复 (直到 到 达 树 的 顶端 ) 。 

这 看 起 来 很 简单 ,但 是 也 有 两 个 问题 。 

问题 1; 如 何 知道 已 经 到 达 了 树 的 顶端 ? 在 一 个 Unix 文件 系统 的 根 目 录 中 ,“. ”和 ".、. 
指向 同一 个 -节点 。 编 程 者 通常 将 下 一 个 指针 置 为 NULL ,用 来 标识 -个 链表 结构 的 结束 。 
Unix 的 设计 者 本 可 以 将 根 目录 的 “.,” 置 为 空 , 但 是 还 是 决定 将 它 指向 本 身 。 考 虚 一 下 这 个 
设计 的 优点 是 什么 ? 回 到 刚才 的 问题 ,基于 以 上 原因 ，pwd 命令 重复 循环 直到 一 个 目录 的 
“OR. .” 的 i 节 点 号 相同 时 ,就 可 以 认为 已 经 到 达 文 件 树 的 顶端 。 

问题 2: 如 何以 正确 的 顺序 显示 目录 和 名字 ? 可 以 建立 一 个 循环 ,使 用 street 或 sprintf # 
立 目 录 名 字 的 字符 串 序 列 。 通 过 一 个 递归 的 程序 逐步 到 达 树 的 顶端 来 一 个 接 一 个 地 显示 目 
录 名 ,从 而 避免 了 字符 申 的 管理 ， 


4.5.2 pwd 的 一 种 版 本 


Ll 


/* spwd.c; a simplified version of pwd 

* 

* starts in current directory and recursively 
* climbs up to root of filesystem, prints top part 
* then prints current part 

* 

* uses readdir() to get info about each thing 
* 
* bug: prints an empty string if run from "/" 
+E’ 

# include | «Zstdio. h> 

H include <lsys/types. h> 

# include —-«sys/stat.hro- 
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jiiinclude «dirent. h 


ino t get inode(char * }; 
void printpathto(ino t); 


void inum to name(ino t , char * , int); 


int main() 

i 
printpathto( get inode( "." } ); /* print path to here x/ 
putchar( 'in'); /* then add newline «/ 
return Ü; 


void printpathto( ino t this inode } 
/* 
* prints path leading down to an object with this inode 
* kindof recursive 
x/ 
i 
ino t my_inode ; 
char its name[ BUFSIZ]; 
if ( get inode("..") I= this inode } 


{ 


chdir( ",."); /* up one dir «/ 
inum to name(this inode,its name,BUFSI2); /* get its name «/ 
my inode = get inode( "."):; /* print head x/ 
printpathto( my inode ); /* recursively «/ 


printf("/ $s", its name 2; /* now print «/ 


Fr 
/* name of this #/ 


} 
void inum to name(ino t inode to find , char x namebuf, int buflen) 
A 
* looks through current directory for a file with this inode 
* number and copies its name into namebuf 
ui 
{ 
DIR * dir ptr; /* the directory */ 
struct dirent * direntp; ' Jx each entry #/ 
dir ptr = opendir( "."); 
if (dir ptr == NULL }į 
perror( "." J; 
exit(1); 
} 
/ * 
* search directory for a file with specified inum 
x/ 
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while ( ( direntp = readdir( dir ptr ) } = NULL) 
if ( direntp—d ino == inode to find) 
4 
strncpy( namebuf, direntp—>d_name, buflen); 
namebuf[buflen- 1] = 'X0'; /x just in case #/ 
closedir( dir ptr ); 
return; 
t 
fprintf(stderr, "error looking for imm * din", inode to find); 
exit(1); 
) 
ino t get inode( char * fname } 
(x 
* returns inode number of the file 
if 
{ 
struct stat info; 
if ( stat( fname , Sinfo) == —1)1 
fprintf(stderr, "Cannot stat "); 
perror( fname) ; 
exit(1); 
} 
return info.st ino; 


} 
下 面 是 命令 pwd 与 spwd 执行 后 的 比较 : 


$ /bin/pwd 
/home/bruce/experiments/demodir/c/d2 
$ sped 

/ bruce/experiments/demodir/c/d2 

$ 


命令 pwd 将 显示 到 达 树 根 的 路 径 , 而 这 个 版 本 在 到 达 树 根 之 前 就 停止 了 。 问 题 在 哪儿 呢 ? 是 
不 是 因为 编码 不 当心 导致 的 问题 ? 不 是 ,程序 实际 上 是 完全 按照 原来 的 设想 工作 的 , 它 在 到 达 文 
件 杀 统 的 根 时 停止 ,只 是 这 个 文件 系统 的 根 并 不 是 这 个 计算 机 上 整 棵 文件 树 的 根 。 

Unix 允许 将 一 个 三 扒 的 存储 组 织 成 一 棵 由 光标 桥 相 互 连 搂 的 树 。 每 个 磁盘 或 磁盘 上 的 
每 个 分 区 都 包含 一 棵 目录 树 。 这 些 独立 的 树 被 连接 成 一 棵 单一 的 几乎 无 各 的 树 。 这 个 版 本 
的 pwd 恰好 碰 上 了 树 之 间 的 连接 地 带 。 


4.6 多 个 文件 系统 的 组 合 : 由 多 棵 树 构成 的 树 


一 个 Unix 系统 有 两 个 磁盘 或 分 区 将 会 如 何 ” 现 在 已 经 知道 ,用 一 些 简 单 的 抽象 能 够 将 
一 个 单一 的 分 区 组 织 成 一 棵 目录 树 。 俱 是 如 果 有 两 个 分 区 ,需要 商标 独立 的 树 吗 ? 
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其 他 的 系统 又 是 如 何 做 的 呢 ? 有些 操作 系统 将 盘 符 或 卷 标 分 配给 每 个 磁盘 或 分 区 ,并 
将 字母 或 名 字 作 为 一 个 文件 全 路 径 的 一 部 分 。 另 一 种 做 法 是 ,有 些 系统 统一 给 所 有 的 磁盘 


分 配 块 的 编号 以 创建 一 个 虚拟 的 单一 磁盘 。 
Unix 使 用 第 三 种 方法 。 每 个 分 区 有 自己 的 文件 系统 树 。 当 计算 机 上 有 多 于 一 个 的 文件 
系统 时 ,Unix 提供 一 种 方法 将 这 些 树 整合 成 一 棵 更 大 的 树 。 图 4. 13 表示 了 这 个 方法 。 


用 户 角度 : 一 棵 树 系统 角度 : 两 个 盘 





4.13 树 的 嫁接 


图 4. 13 中 用 户 看 到 的 是 一 棵 完好 的 目录 树 , 但 是 实际 上 有 两 棵 树 , 一 个 在 磁盘 1 上 ,一 
个 在 磁盘 2 上 。 每 棵 树 都 有 一 个 根 目录 。 一 个 文件 系统 被 命名 为 根 文件 系统 ,这 棵 树 的 顶端 
是 整 棵 树 的 真正 的 根 ; 另 一 个 文件 系统 则 被 附加 到 根 文件 系统 的 某 个 子 目 录 上 。 在 内 部 ,内 
核 在 根 文件 系统 将 一 个 目录 作为 指针 ,指向 另 一 个 文件 系统 的 根 ,这 样 两 个 文件 系统 就 联系 
起 来 了 。 


4.6.1 装载 点 


在 Unix 中 ,装载 文件 系统 (to mount a file system) 是 指 将 它 垦 入 到 已 有 的 系统 以 获得 
某 些 支 持 , 子 树 的 根 目录 被 嵌入 到 根 文件 系统 的 一 个 目录 中 , 子 树 所 在 的 目录 被 称 做 第 二 个 
系统 的 装载 点 (mount point). 

命令 mount 列 出 当前 所 装载 的 文件 系统 以 及 它们 的 装载 点 : 


S mount 
/dev/hdal on / type ext2 (rw) 

/dev/hda6 on /home type ext2 (rw) 

none on /proc type proc (rw) 

none on /dev/pts type devpts (rw, mode - 0620) 
$ 


输出 的 第 一 行 表 明 /dev/hda 上 的 分 区 1( 第 一 个 IDE 设备 ) 被 装载 在 树 的 根 目录 上 。 这 
个 分 区 是 根 文件 系统 。 输 出 的 第 二 行 表明 dev/hda6 上 的 文件 系统 被 装载 在 根 文件 系统 的 / 
home 目录 上 。 因 此 , 当 用 户 使 用 chdir 从 “/” 进 入 “/home” 时 ,实际 上 是 从 一 个 文件 系统 进 
人 了 另 一 个 文件 系统 。 当 该 pwd 沿 树 向 上 回溯 时 , 它 就 会 停 在 /home, 因 为 它 到 达 了 该 文件 
系统 的 顶端 。 
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Unix 允许 不 同类 型 的 文件 系统 被 装载 在 根 文 件 系统 .例如 ,一 个 含有 ISO 9660 文件 系 
统 的 CD-ROM 能 够 被 装载 在 一 个 Unix 8L88 E ,并 且 盘 上 的 目录 和 文件 将 会 成 为 树 的 一 部 
分 。 如 果 内 核 包 会 知道 如 何 与 Macintosh 文件 系统 协同 上 作 的 驱动 程序 ,那么 一 个 售 有 
Macintosh 文件 系统 的 磁 栖 就 能 够 被 装载 。 甚 至 ,通过 网 络 连接 的 其 他 的 计算 机 上 的 文件 系 
统 也 能 够 被 装载 。 


4.6.2 多 重 ji- 节 点 号 和 设备 交叉 链接 


将 不 同 的 文件 系统 合成 一 棵 树 有 很 多 优点 ,当然 也 有 小 问题 。 在 Unix 中 ,每 个 文件 都 
有 一 个 i 一 节点 号 ,就 像 两 条 不 同 的 街道 都 有 一 个 门牌 号 为 402 的 房子 一 样 ,两 个 不 同 的 磁 
盘 可 能 都 含有 i- 节 点 号 为 402 的 文件 。 若 干 个 目录 可 能 都 含有 i- 节点 号 为 402 的 文件 ,内 
核 是 如 何 知道 应 该 使 用 哪个 402 的 i- 节点 呢 ? 

仔细 观察 图 4. 14 中 被 圈 出 来 的 两 个 目录 ,一 个 在 根 文 件 系统 ,一 个 在 被 装载 的 文件 系 
统 。 每 个 目录 都 包含 一 个 i- 节点 402 的 链接 。myls. < 和 y. old 似乎 为 指向 同 - -个 i- 节 点 的 
两 个 链接 ,但 是 那个 i- PAER? 磁盘 ] 上 的 文件 系统 有 一 个 i- 节 点 402 ,磁盘 2 上 的 文 
件 系 统 有 一 个 不 同 的 i- 节点 402。 这 两 个 链接 根本 不 指向 同一 个 文件 。 





Hal -节点 号 和 文件 系统 


这 个 例子 列举 了 一 个 由 树 连接 成 树 的 一 个 间 题 , 即 一 个 i- 节点 号 并 不 惟一 地 标识 一 个 
文件 了 。 就 像 刚 刚 看 到 的 那样 ,相同 的 i- 节点 号 402 出 现在 两 个 不 同 的 目录 中 , 却 指向 2 个 
不 同 的 文件 。 看 起 来 这 两 个 链接 指向 同一 个 文件 ,但 实际 上 却 不 是 ， 

如 何 从 不 同 的 文件 系统 生成 指向 同 .个 文件 的 链接 ? 这 一 点 是 无 法 做 到 的 ,文件 以 数 
据 块 的 集合 和 一 个 i- 节 点 的 形式 出 现在 磁盘 上 ,日 录 中 的 链接 会 指向 那个 i- 节点 。 如 果 一 
个 磁盘 上 的 链接 指向 另 . 一 个 磁盘 上 的 i 一 节点 将 会 发 生 什 么 事 ? 如果 另 一 个 磁盘 未 被 装载 ， 
文件 则 会 不 存在 。 更 糟糕 的 是 ,如 果 一 个 存储 着 拥有 i 一 节点 402 ER A [EC PERS AS [e] Ba EE 
装载 , 则 文件 的 内 容 就 完全 不 同 了 。 你 也 可 以 想到 其 他 麻烦 的 情况 。 

link 和 rename 系统 调用 知道 这 种 情况 吗 ?* 知道 。link 拒 鸳 创建 跨越 设备 的 链接 ， 
rename 拒绝 在 不 同 的 文件 系统 间 进 行 j- 节 点 号 的 转移 。 阅读 手册 可 以 了 解 它们 记 返 侣 的 
错误 代码 。 
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4.6.3 符号 链接 


TEREE Chard tinks) 是 将 目录 链接 色 树 的 指针 , 硬 链接 同时 也 是 将 文件 名 和 文件 本 身 链 
接 起 来 的 指针 。 

硬 链 接 不 能 指向 其 他 系统 中 的 记 节 点 ,即使 根 也 不 能 生成 到 目录 的 链接 。 也 许 有 支持 
这 种 跨 系统 链接 的 理由 ,但 Unix 支持 另 一 种 形式 的 链接 : 符号 链接 。 符 号 链接 通过 名 字 引 
用 文件 ,而 不 是 i- 节点 号 。 以 下 是 它们 的 比较 : 


$ who > whoson 

$ in whoson ulist 

$ ls -li whoson ulist 

377 -rw-r--r-- 2 bruce users 235 Jul 16 09;42 ulist 

377  -rw-r--r-- 2 bruce users 235 Jul 16 09:42 whoson 

§ ln ~ 5 whosen users 

S ls -li whoson ulist users 

377 -rw-r-r-- 2 bruce users 235 Jul 16 09.42 ulist 

289  lrwxrwxrwx 1 bruce users 6 Jul 16 09:43 users -> whoson 
377  -rw-r-r-- 2 bruce users 235 Jul 16 09:42 Whoson 


文件 whoson 和 ulist 是 指向 同 个 文件 的 链接 。 两 个 都 拥有 i- 节点 写 377, 都 有 同样 的 
文件 大 小 .修改 时 间 和 链接 数 。 通 过 命令 In 创建 硬 链接 ulist, 

另 一 方面 ,命令 ln -s 生成 文件 whoson 的 一 个 符号 链接 ,并 把 这 个 新 链接 称 为 users, 
ls -li 显示 users 拥有 i- 节点 289。 字 母 1 在 文件 类 型 点 处 表明 users 是 一 个 符号 链接 。 链 
接 数 .修改 时 间 和 文件 大 小 都 不 同 于 原始 文件 。 文 件 users 并 不 是 原始 文件 whoson, 但 是 当 
程序 对 它 进行 读 写 时 , 它 就 像 原始 文件 一 样 。 例 如 : 


5 wc - 1 whoson users 
5 whoson 
5 users 
10 total 
§ diff whoson users 


^ 
a 


命令 we 和 diff 分 别 用 于 对 文件 计算 行 数 和 比较 内 容 . 在 这 种 情况 下 ,内核 使 用 名 字 找 
到 原始 文件 。 另 一 方面 ,对 函数 stat 的 调用 返回 关于 链接 的 信息 , 而 不 是 关于 原始 文件 了 的 ， 

符 叶 链接 可 能 跨越 文件 系统 ,因为 它们 并 不 存 情 原 始 文件 的 i- 节 点 。 符 号 链接 也 可 以 
指向 目录 ,因为 它们 与 将 文件 系统 联系 在 一 起 的 真正 的 链接 不 同 。 

在 交叉 设备 链接 的 情况 中 符号 链接 也 存在 前 面 所 讨论 的 间 题 ,如 果 保 存 原 始 文 件 的 文 
件 系统 被 删除 了 ,或 者 床 始 文件 有 了 新 的 文件 名 ,符号 链接 都 将 指向 空 。 如 果 一 个 拥有 相同 





也 ”系统 调用 lstat 返回 链接 所 指导 的 文件 的 信息 。 
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名 字 的 文件 被 加 载 了 ,符号 链接 则 将 指向 不 同 的 文件 ,指向 目录 的 符号 链接 可 以 指向 父 目 
录 , 因 此 在 目录 树 中 产生 循环 套 。 符 号 链接 可 以 将 你 的 文件 系统 彻底 摘 乱 ,但 是 内 核 知道 这 
些 仅 是 符号 链接 ,而 不 是 真正 的 链接 ,所 以 能 够 检查 丢失 的 引用 和 死 循环 。 

系统 调用 symlink 用 于 创建 一 个 符号 链接 。 系 统 调用 readlink 用 于 获取 原始 文件 的 名 
字 。lstat 用 于 获取 原始 文件 的 信息 。 阅 读 联 机 帮助 可 以 了 解 unlink, link 和 符号 链接 是 如 
何 作 用 的 。 


小 8 


l. 主要 内 容 
。 Unix 将 存储 在 磁盘 中 的 数据 组 织 成 文件 系统 。 文 件 系统 是 文件 和 目录 的 集合 。 目 
录 是 名 字 和 指针 的 列表 。 目 录 中 的 每 一 个 人 口 指向 一 个 文件 或 目录 。 目 录 包 含 指向 
父 目 录 和 子 目 录 的 人 口 。 
Unix 文件 系统 包含 3 个 主要 部 分 : 超级 块 i- 节 点 表 和 数据 区 域 。 文件 内 容 存 储 在 
数据 块 。 文 件 属性 存储 在 i- 节点 。 表 中 i- 节点 的 位 置 称 为 文件 的 i- 节点 号 。i-- 节 
点 号 是 文件 的 惟一 标识 。 
相同 的 i- 节点 号 可 能 以 不 同 的 名 字 在 若干 个 目录 中 出 现 。 每 个 人 口 被 称 为 指向 文 
件 的 硬 链 接 。 符 号 链接 是 通过 文件 名 引用 文件 ,而 不 是 i- 节 点 号 。 
若干 个 文件 系统 的 目录 树 可 被 整合 成 一 棵 树 。 内 核 将 一 个 文件 系统 的 目录 链接 到 另 
一 个 文件 系统 的 根 的 操作 称 为 装载 。 ; 
Unix 包含 若干 种 系统 调用 ,允许 程序 员 进 行 创建 和 删除 目录 复制 指针 、 删 除 指针 、 
改变 连接 和 分 离 其 他 文件 系统 等 的 操作 。 

2. 图 示 

日 录入 口 是 文 件 名 和 i- 节点 号 组 成 的 对 。i- 节 点 号 指向 磁盘 上 的 一 个 结构 ,该 结构 包 
含 文件 信息 和 数据 块 的 分 配 , 如 图 4. 15 所 示 。 





图 4.15 i- 节 点 、 数 据 块 .目录 、 指 针 
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3. 下 一 章 的 内 容 

文 忻 只 是 一 种 类 型 的 数据 源 。 程 序 也 可 处 理 来 自 守 像 终 端 , 数 码 相机 ,扫描 仪 等 设备 的 
SCH. Unix 程序 如 何 从 设备 读 取 数据 和 发 送 数 据 呢 ? 

A, 习题 


4.1 


4. 2 


4.4 


pwd 显示 京 件 系统 中 到 达 当 前 目录 的 路 径 。 从 某 种 意义 上 说 ,那个 目录 是 在 树 中 
所 处 的 位 置 。 实际 上 该 目录 是 一 些 字 节 的 集合 ,而 这 个 集合 存储 在 磁盘 上 的 某 个 
位 置 ,该 位 置 能 以 往 面 .磁头 . 扇 区 和 字 节 的 方式 定位 。 有 办 法 将 当前 工作 呈 录 转 
换 成 这 些 硬 件 位 置 吗 ” 


看 一 下 所 使 用 的 系统 中 的 一 个 厂 盘 。 找 出 它 有 多 少 个 分 区 ,确定 登 个 分 区 的 记 节 
点 的 个 数 和 数据 块 的 个 数 。 


Unix 不 仅仅 是 在 内 部 使 用 将 磁盘 抽象 成 序列 的 方法 创建 文件 系统 ,而 量 它 使 得 这 
个 抽象 方法 适用 于 任何 拥有 合法 权限 的 用 户 。 要 做 这 个 实验 ,需要 有 最 高 权限 ， 
即 管理 员 权 限 。 

/dev 目录 包含 允许 你 从 磁盘 块 中 读 取 字 节 的 设备 描述 文件 ,从 设备 读数 据 的 时 候 
可 以 认为 数据 就 在 这 些 文件 中 。 在 一 个 装 有 IDE 设备 的 Linux 系统 上 ,可 以 看 到 
AR dev/hda, /dev/hdb,dev/hdc./dev/hdd 的 文件 。 这 些 设备 文件 不 是 像 /etc/ 
passwd BE /var/adm/utmp 这 样 的 常规 数据 文件 。 这 些 数 据 文件 提供 对 磁盘 上 原 
始 数 据 的 访问 ,而 且 可 以 使 用 cat. more.cp 和 其 他 的 命令 来 读 取 磁盘 上 的 内 容 ， 
就 像 文件 ump 一 样 ,磁盘 有 一 个 清晰 的 结构 。 一 氛 接 一 抉 地 查看 磁盘 内 容 的 一 
种 方法 是 使 用 命令 od -e /dev/hda | more。 当 查看 该 命令 的 输出 时 ,就 会 觉得 磁 
盘 是 一 个 顺序 的 .连续 的 磁盘 据 一 样 。 每 个 分 区 都 由 其 中 的 一 个 特定 文件 表示 。 


fü. /dev/hda 上 的 第 一 个 分 区 被 称 为 /devyhdal 。 


查看 系统 中 的 /dev 目录 , 找 上 出 对 应 于 系统 上 硬盘 驱动 .软盘 驱动 .CD-ROM 驱动 
和 其 他 磁盘 驱动 的 特定 文件 。 


本 章 中 提 到 内 核 在 新 建 一 个 文件 时 需要 找到 一 个 空 的 i- 节点 和 空 的 磁盘 块 。 内 
核 如 何 知道 哪些 磁盘 块 是 空 的 ? 哪些 i~ 节 点 是 空 的 ? 你 机 器 上 的 文件 系统 使 用 
什么 方法 跟踪 那些 未 被 使 用 的 磁盘 块 和 i- 节 点 呢 ? 


Unix 能 够 读 取 和 装载 包含 非 Unix 文件 系统 的 磁盘 , 像 PC-DOS 和 Macintosh R 
盘 。 在 内部, 这些 系 统 没 有 i- 节 上 点。 虽然 如 此 , 当 使 用 命令 mount HA p— pw 
盘 连 接 到 Unix 系统 时 ,命令 ls -i 将 会 列 出 i- 节 点 。 

查看 Linux 源 代 码 以 确定 这 些 编 号 从 和 何 处 来 。Linux 为 何 添加 它们 ? 


本 章 中 通过 描述 包含 10 个 直接 块 .1 个 同 接 抉 ,1 个 二 级 间接 块 和 1 = 

的 i~ 节 点 解释 了 分 配 列表 。 有 些 Unix 版 本 使 用 不 同 的 编号 。 

(1) 你 所 使 用 的 系统 上 的 ;~ 节点 分 配 列表 的 格式 是 怎样 的 ? 头 文件 应 该 包含 这 
些 详细 内 容 。 
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(2) 你 系统 上 的 一 个 数据 块 的 大 小 是 多 少 ? 

(3) 在 你 的 系统 上 ,不 使 用 间接 块 的 最 大 文件 是 什么 ? 

CD. 在 你 的 系统 上 ,不 使 用 二 级 间接 块 的 最 大 文件 是 什么 ? 最 大 的 文件 实际 上 用 
TEDAR? 


一 个 文件 可 能 有 多 个 链接 。 链 接 计 数 器 记录 了 文件 的 链接 个 数 。 那 么 目录 如 何 
Wé? 在 你 自己 的 demodir HP fe ls -1 找 出 每 个 目录 的 链接 数 。 将 这 些 链接 数 
和 图 天上 的 箭头 相 比 较 。 解 释 日 录 链 接 数 的 意思 。 为 什么 每 个 目录 的 链接 数 至 
少 为 29 


没有 人 能 够 使 用 link 生成 到 目录 的 新 链接 。 在 过 去 ,超级 用 户 有 权 生 成 到 目录 的 
硬 链 接 。 在 demodir 的 例子 中 ,观测 在 用 户 视图 和 系统 视图 中 添加 系统 调用 link 
("demodir/c", "demodir/d2/e') 执行 后 所 产生 的 普 果 。 然 后 解释 命令 1s -iaR 
demodir 将 产生 什么 结果 。 


当 使 用 mount 命令 将 一 个 文件 系统 装载 到 另 一 个 文件 系统 ,装载 点 必须 是 原 有 文 
件 系 统 的 一 个 目录 。 考 虑 将 /devyhdad 上 的 文件 系统 连接 到 /home2 这 个 目录 上 
的 情况 ;思考 以 下 两 个 问题 ; (1) 如 果 /home2 这 个 装载 点 不 存在 将 产生 什么 结果 ? 
C2) 如 果 装 载 点 存在 ,和 且 包含 文件 和 子 目 录 , 将 产生 什么 结果 ? 


命令 rmdir 不 删除 含有 文件 或 子 目 录 的 目录 。 为 什么 要 这 么 做 ? 

田 一 方面 ,可 以 删除 含有 用 户 的 目录 。 尝 试 以 下 的 操作 ; 生成 一 个 由 自己 命名 的 
新 目录 并 进入 这 个 目录 ,然后 开启 另 一 个 命令 窗口 ,删除 这 个 新 目录 。 关 闭 第 二 
个 命令 窗口 ,输入 命令 /bin/pwd, 看 看 将 产生 什么 。 


硬盘 上 的 柱 面 4ecylinder) 是 什么 意思 ? 硬盘 的 物理 构造 是 行 么 使 得 柱 面 这 个 概念 
对 有 效 利 用 磁盘 如 此 重要 ? 在 网 上 查找 柱 面 组 (cylinder group) 这 个 概念 。 解释 
这 个 概念 和 本 章 中 文件 系统 模型 之 间 的 联系 。 


很 多 人 都 了 解 磁盘 室 间 不 足 这 个 概念 。 一 个 Unix 文件 系统 有 一 个 i~ 节 点 区 域 
和 一 个 数据 区 域 。 因 此 ,即使 数据 区 有 空间 ,i- 节 点 空间 也 有 可 能 不 足 。 当 在 
Unix 上 安装 了 一 个 新 的 磁盘 , 策 要 将 磁盘 分 成 1- 节 点 表 和 数据 区 。 文 件 系统 上 
的 每 个 文件 都 需要 一 个 i- 节 点 。i- 节 点 表 越 大 , 留 给 文件 内 容 的 室 间 越 小 。 
假设 要 安装 一 个 新 的 硬盘 。 命 令 mkfs 生成 一 个 新 的 文件 系统 并 且 让 你 确定 i- 
节点 表 的 大 小 。 阅 读 联机 帮助 以 了 解 这 个 命令 。 为 什么 需要 大 量 的 ~- 节点? 为 
什么 有 时 候 又 比 常规 需要 的 少 ? 











系统 调用 stat 接 爱 文件 名 和 指向 结构 的 指针 ,并 且 将 文件 信息 填充 到 该 结构 中 。 
解释 stat 是 如 何 通 过 使 用 目录 、i -节点 和 数据 模型 来 完 战 该 功能 的 。 它 是 从 哪 
里 找到 数据 并 将 数据 复制 到 stat 结构 中 的 呢 ? 
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5.. 编程 练习 


4. 


4. 


4. 


14 


15 


16 


.18 


. 20 


编写 一 个 创建 整个 demodir 日 录 树 的 Unix 命令 ， 
Unix 命令 mkdir 接受 选项 -p。 编 写 一 种 支持 这 个 选项 的 mkdir 命令 版 本 。 


命令 mv 不 仅仅 调用 系统 调用 rename, AB … 种 接受 两 个 参数 的 mv 版 本 。 第 
一 个 参数 必须 是 文件 名 ,第 二 个 参数 是 文件 名 或 目录 和 名。 如 果 目 标 是 个 目录 和 名， 
则 mv #XABAARTAR. BW. WRT RHA. my 将 重 命名 这 个 文件 。 


本 章 中 提供 了 一 种 使 用 link 和 unlink 编写 的 rename 版 本 。 该 代码 片断 检验 
link 的 返回 值 , 但 是 并 未 检验 unlink 的 返回 值 。 扩 充 该 段 代码 ,使 得 它 能 够 正确 
处 理 unlink 的 错误 信息 。 





阅读 联机 帮助 和 头 文 件 以 了 解 系 统 上 的 超级 块 的 结构 。 编 写 一 个 能 够 打开 文件 
系统 .阅读 超级 志 和 以 清晰 可 读 的 格式 显示 文件 系统 设 苞 的 程序 。 这 个 练习 与 
显示 utmp 记录 内 容 和 stat 结构 的 程序 类 似 。 





对 新 建 一 个 文件 的 解释 列 出 了 4 个 主要 的 操作 。4 个 操作 必须 完全 正确 才能 使 

文件 能 够 被 正确 添加 到 文件 系统 。 如 果 计 算 机 在 这 一 系列 的 操作 中 突然 掉 电 将 

会 发 生 什么 情况 ?例如 ,如 果 数 据 被 存储 在 了 数据 区 ,而 i- 节点 还 未 被 分 配 ,将 

RA AB? 

CD 为 这 4 个 操作 选择 一 种 顺序 ,并 加 以 解释 。 

(20 现在 很 设 一 个 系统 按照 (1) 的 管 案 被 创建 ,如 果 系 统 在 这 个 过 程 中 突然 崩溃 
将 怎么 办 ? 例如 ,你 的 过 程 有 4 个 步骤 .3 个 中 间 点 ,在 每 个 点 的 前 省 将 会 导 
致 文件 系统 的 哪些 不 一致 性 呢 ? 

(3) 阅读 Unix 命令 fscek。 看 看 (27 的 答案 和 fsck 寻找 的 内 容 有 和 多少 是 接近 的 。 


在 第 3 章 中 编写 了 ls -1 的 一 个 版 本 。 修改 那个 程序 ,使 得 它 不 仅 能 够 显示 原先 
的 信息 ,还 能 显示 -节点 号 。 另 外 ,你 的 新 版 本 的 Ts 是 从 哪里 找到 1- 节点 号 的 ? 








6. HA 
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find,du,ls —R,mount, dump 

















概念 与 技巧 

， 文件 和 设备 间 的 相似 之 处 
， 文件 和 设备 馈 的 不 同 之 处 
* 连接 的 属性 

。 竞争 和 原子 操作 

， 控制 设备 驱动 程序 

> 流 

相关 的 系统 调用 

+ fentl,ioctl 

* tesetattr,tcgetattr 

相关 命令 

* stty 


* write 


5.1 为 设备 编程 


前 面 章节 中 已 经 讲述 了 `- 些 与 文件 和 目录 相关 的 程序 。 计 算 机 还 有 其 他 的 数据 来 源 ， 
如 调制 解 调 吉 、 打 印 机 扫描 仪 .里 标 ,扬声器 .照相 机 和 终端 等 这 样 的 外 部 设备 。 在 本 章 中 
将 学 习 这 些 设备 与 上 四 录 和 文件 的 相似 之 外 和 不 同 之 处 ,并 了 解 如 何 将 这 些 想法 用 于 管理 设 
备 闻 的 连接 。 

本 章 的 项 只 是 编写 命令 stty 的 男 外 一 个 版 本 。stty 用 来 让 用 户 检测 、 修 改 控制 键盘 和 
mae REN RE 


5.2 设备 就 像 文件 


很 多 人 认为 文件 是 -- 些 存储 在 磁盘 上 的 数据 ,但 是 Unix 采用 一 种 更 抽象 的 方法 。 首 先 
考 虚 文件 的 实际 情形 ; 文件 包含 数据 ,具有 属性 ,通过 目录 中 的 名 字 被 标识。 可 以 从 一 个 文 
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件 该 取 数据 ,也 可 以 向 一 个 文件 写 和 数据。 现在 请 注意 ,这 种 方法 将 被 应 用 于 设备 。 

考虑 一 块 连接 到 麦克 风 和 扬声器 的 声卡 。 你 对 着 斑 克 风 说 话 , 声 卡 将 来 自 你 声音 的 信 
号 转换 成 数据 流 ,使 得 程序 能 够 读 取 这 个 数据 流 。 当 程序 向 声卡 写 人 数据 流 时 ,声音 就 从 扬 
声 器 中 出 来 。 对 一 个 程序 来 说 ,声卡 既是 数据 的 流 , 又 是 数据 的 目的 地 。 

一 个 带 有 键盘 和 和 显示 器 的 终端 也 和 文件 类 似 。 键盘 输 入 就 像 数 据 一 样 能 够 被 程序 读 
取 , 而 一 个 进程 把 写 人 终端 的 字符 显示 在 屏幕 上 。 

对 Unix 来 说 ,声卡 .终端 .鼠标 和 磁盘 文件 是 同一 种 对 象 。 在 Unix 系统 中 ,每 个 设备 都 
被 当 居 一 个 文件 。 竺 个 设备 都 月 一 个 文件 名 .一 个 i- 节 点 号 .一 个 文件 所 有 者 .一 个 权限 位 
的 集合 和 最 近 修 改 时 间 。 你 所 了 解 的 和 文件 有 美的 所 有 内 容 都 将 被 运用 于 终端 和 其 他 的 
设备 。 
5.2.1 设备 具有 文件 名 


每 个 加 载 到 Unix 机 器 的 设备 (终端 ,打印 机 ,和 刀 标 ,磁盘 等 ) 都 通过 文件 名 表示 。 通 常 ， 
表示 设备 的 文件 存放 在 目录 /dev 中 ,但 是 可 以 在 性 何 目录 中 创建 设备 文件 。 请 查看 不 局 
Unix 机 器 上 的 /de 目录 。 以 下 是 我 所 使 用 的 机 器 上 的 部 分 列表 ， 


$ ls -C /dev | head -5 


XOR fdlu720 loap] ptygt sda? stderr ttysd . 
agpgart fdlu800 ipo ptyrÜ sdaB stdin ttyse 
apm bios  fdlu820 ipl ptyrl sdaQ stdout ttysf 
ared fd] u830 lp2 ptyr2 edb tape ttyto 
dsp flashod med ptyr3 gdhi tcp ttytil 


这 个 列表 显示 了 者 干 种 设备 。 第 三 列 中 的 Ip 文件 是 打印 机 。 第 二 列 中 的 fd* 文件 是 
AKIK. sd» 文件 是 SCSI 设备 的 分 区 ,/dev/tape 是 磁带 备份 驱动 程序 的 设备 文件 。 最 后 一 
列 中 的 tty x 文件 是 终端 。 程 序 通 过 读 取 这 些 文件 获得 用 户 的 键盘 输入 ,通过 写 人 这 些 文件 
向 终端 屏幕 发 送 数 据 。 

dsp 文件 是 到 声卡 的 一 个 这 楼。 进程 通过 向 该 设备 文件 写 人 字 节 来 运行 一 个 声音 文件 。 
进程 可 以 通过 打开 文件 /dev/mouse 来 读 取 鼠标 的 单 击 和 位 置 的 变化 。 


5.2.2 设备 和 系统 调用 
设备 不仅 具有 文件 名 ， 而 且 交 持 与 所 有 文件 相关 的 系统 调用 ， open, read. write, lseek , 


close 和 stat, 


BSN). AA RE AY E BUBUR A IB a F : 

int fd; 

fd = open ("/dev/tape",O RDONLY); /* connect to tape drive «/ 
lseek (fd, (long)4096, SEEK SET); /* fast forward 4096 bytesx/ 
n - read (fd, buf, buflen); /* read data from tape «/ 


close (fd); /* disconnect «/ 
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和 磁盘 文件 相关 的 系统 调用 同样 可 以 为 其 他 设备 服务 。 实 际 上 ,Unix 没有 其 他 的 方法 
用 来 和 设备 通信 。 

当 你 移动 恨 标 并 按键 ,鼠标 将 数据 发 送 到 系统 ,使 得 进程 能 够 读 取 它们 。 向 设备 写 入 数 
据 意味 着 什么 呢 ? 发 送 数 据 到 鼠标 ,不 会 使 角 标 移动 ,也 不 会 使 鼠标 的 键 被 按 下 。 
/dev/mouse 文 忻 不 支持 所 有 的 write 系统 调用 。 当 然 , 可 以 制造 带 有 发 动机 的 鼠标 ,然后 编 
写 一 个 更 高 级 的 鼠标 驱动 程序 ,使 得 系统 能 够 接受 并 产生 和 鼠标 事件 ， 

终端 支持 read 和 write 但 不 支持 lseek。 考 虑 一 下 这 是 为 什么 呢 ? 


5.2.3 例子 : 终端 就 像 文件 


Unix 的 很 多 用 户 输入 来 自 终 端 。ttysd .ttyse 等 文件 都 代表 终端 。 按 传统 定义 终端 是 链 
盘 和 显示 单元 ,但 实际 可 能 包括 一 个 20 世纪 ?0 年 代 生 产 的 打印 机 .一 个 键盘 和 一 个 串 行 接 
口 的 显示 属 , 或 是 一 个 调制 解 调 器 和 通过 拨号 上 网 的 软件 。 在 因特网 登录 的 telnet 或 ssh 窗 
口 也 可 以 认为 是 一 个 终端 。 终 端 最 重要 的 功能 是 接受 来 自用 户 的 字符 输入 和 将 输出 信息 显 
示 给 用 户 。 显 示 输 出 单元 其 至 可 以 产生 育 文 打印 或 声音 。 

命令 uy 用 来 告知 用 户 所 在 终端 的 文件 名 。 用 终端 文件 懒 以 下 试验 : 





$ tty 
/dev/pta/2 
$ cp /etc/notd /dev/pts/2 
Today is Monday, we are running low on disk space. Please delete files. 
- your sysadmin 
$ who > /dev/pts/2 
bruce  pts/2 Jul 17 23;35 (ice, northpole. org) 
bruce  pts/3 dul 16 02:03 (snow. northpole. org) 
$ ls - li /dev/pta/2 
4 crw--w--w— 1 bruce tty 136, 2 Jul 18 03:25 /dev/pts/2 


从 以 上 输出 可 以 知道 ,终端 try 对 应 的 设备 描述 文件 名 为 /dev/pts/2。 可 以 对 该 文件 使 
用 任何 与 文件 相关 的 命令 和 进行 任何 文件 操作 ,如 cp EE >” mv In rm cat a Is 等 
各 种 命令 。 

命令 cp 从 普通 文件 /etc/motd 中 读 取 数 据 , 向 设备 文件 /dev/pts/2 写 人 数据 ,使 得 内 
窒 能 够 显示 在 屏幕 上 。 写 入 设备 文件 就 是 向 设备 写 人 字 节 ,例子 中 的 下 一 行 表 盟 将 带 有 
HE IRI TE" TUB) who 的 输出 内 容 发 送 到 /dev/pts/2, 并 将 数据 以 字符 的 形式 最 示 在 屏 
PEY, 


5.2.4 设备 文件 的 属性 


设备 文件 具有 磁盘 文件 的 大 部 分 属性 。 上 面 ls 的 输出 内 容 表明 /dev/ptsy2 拥有 ji- 节点 
4 权限 位 为 rw--w--mw- ;1 个 链接 ,文件 所 有 者 bruce 和 组 tty, Be iF E ok AY [np Jul 18 at 








OD 这 有 点 像 让 人 用 的 点 字 法 ， 
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03:25。 文 件 类 型 是 “ce”, 表 示 这 个 文件 实际 上 基 以 字符 为 单位 进行 传送 的 设备 。 权 限 位 看 起 
RA MAE RAM 136,2 显示 在 表示 文件 大 小 的 地 方 , 它 有 和 什么 特 殊 的 含义 呢 ? 

CL) 设备 文件 和 文件 大 小 

常用 的 磁盘 文件 由 字 节 组 成 ,磁盘 文件 中 的 字 节 数 就 是 文件 的 大 小 。 设 备 文件 是 链接 ， 
而 不 是 容器 。 键 盘 和 鼠标 不 存储 市 键 数 和 点 击 数 。 设 备 文件 的 i- 节 点 存储 的 是 指向 内 核子 
程序 的 指针 ,而 不 是 文件 的 大 小 和 存储 列表 。 内 核 中 传输 设备 数据 的 子 程序 被 称 为 设备 驱 
动 程序 。 

在 /dev/pts/2 这 个 例子 中 ,从 终端 进行 数据 传输 的 代码 是 在 设备 一 进程 表 中 编号 为 136 
的 子 程序 。 该 子 程 序 接 受 一 个 整 型 参数 。 在 /dev/pts/2 中 ,参数 是 2。136 和 2 这 两 个 数 被 
称 为 设备 的 主 设备 号 和 从 设备 号 。 主 设备 号 确定 处 理 该 设备 实际 的 子 程序 ,而 从 设备 号 被 
”作为 参数 传输 到 该 子 程序 。 

(2) 识 备 文件 和 权限 位 

每 个 文件 都 有 相应 的 读 , 写 和 执行 的 权限 。 当 文件 实际 上 表示 设备 时 ,权限 位 表示 什么 
TRR? 向 文件 写 人 数据 就 是 把 数据 发 送 到 设备 ,因此 ,权限 写意 味 着 允许 向 设备 发 送 数 
据 。 在 这 个 例子 中 ,文件 所 有 者 和 组 tty 的 成 员 拥 有 写 设备 的 权限 ,但 是 只 有 文件 的 所 有 者 
有 污 取 设备 的 权限 。 读 取 设 备 文件 就 像 读 取 普 通 文 件 一 样 ,从 文件 获得 数据 。 如 果 除 了 文 
PFN B BA BABAI BEA BER /dev/ pts/ 2 那么 其 他 人 也 能 够 读 取 在 该 键 番 上 输入 的 字 
符 , 读 取 其 他 人 的 终端 输 和 会 引起 某 些 麻烦 ， 

丸 一 方面 ,向 其 他 人 的 终端 写 人 字符 是 Unix 中 write 命令 的 目标 。 


5.2.5 编写 write 程序 


在 即时 消息 和 聊天 室 出 现 之 前 ,Unix 用 户 通 过 使 用 命令 write 和 在 其 他 终端 上 的 用 户 
WX. 








$ man 1 write 
WRITE(1) Linux Programmer's Mannual WRITE(1) 
Name 
write 一 send a message to another user 
SYNOPSIS 
write user [ttyname ] 
DESCRIPTION 
Write allows you to communicate with other users by copying lines from you terminal to 
theirs. 
When you run the write command, the user you are writing to gets a message of the form: 


Message from yourname(@ yourhost on yourtty at hh.mm 


Any further lines you enter will be copied to the specified user's terminal. If the nther user 
wants to reply, they must run write as well. ， 
When you are done, type an end — of — file or interrupt character. The other user will see the 


message EOF indicating that the conversation is over. 














* 128 。 Unix/Linux 编程 实践 教程 





以 下 这 个 简单 的 write RAL RE RAR, WAR RK “Message from... “这些 提 示 信 
A ,并且 需要 的 参数 是 终端 的 文件 名 (ttyname) ,而 不 是 其 他 人 的 用 户 名 : 





/* writed.c 
* 
* purpose; send messages to another terminal 
* method: open the other terminal for output then 
* copy from stdin to that terminal 
* shows; a terminal is just a file supporting regular i/o 
* usage; write? ttyname 
af 
H include <stdio.h> 
# include — «fentl.h-- 
main( int ac, char = av[]) 
i 
iut fd; 
char buf[ BUFSIZ]; 
/* check args x/ 
if (ac !» 2) 
fprintf(stderr, "usage; write ttyname\n"}; 
exit(1); 
} 
/* open devices »/ 
fd = open( av[1], 0 WRONLY 5; 
if { fd == -1)! 
perrorlav[1]); exit(1); 
} 
/* loop until EOF on input */ 
while( fgets(buf, BUFSIZ, stdin} |= NULL) 
if C writeCfd, buf, strlen(buf)) == -1) 
break; 
CloseC fd); 





仔细 阅读 这 段 代码 ,在 这 里 找 不 到 键盘 连接 到 其 他 用 户 屏幕 所 需 的 特殊 特征 。 这 个 简 
单 的 write 程序 将 一 个 文件 的 内 容 一 行 行 地 复制 到 另 一 个 文件 。 这 个 例 程 和 前 面 章 节 中 的 
例子 表明 终端 就 像 其 他 连接 到 Unix 机 器 的 设备 一 样 ,能 够 以 磁盘 文件 的 方式 被 处 理 。 


5.2.6 设备 文件 和 ji- 节点 

这 些 设备 文件 是 如 和 何 工作 的 呢 ? Unix 文件 系统 的 ij- 节点 和 数据 块 是 如 何 支持 设备 文 
件 这 个 概念 的 ? 图 5.1 显示 了 它们 之 间 的 关系 。 

目录 是 文件 名 和 i 一 节点 号 的 列表 。 日 录 并 不 能 区 分 哪些 文件 名 代表 汶 盘 文件 , 嘱 些 文 
件 各 代表 设备 。 文 件 类 型 的 区 别 体 现在 i 一 节点 上 。 
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磁盘 文件 的 =! l 






图 5.1 指向 数据 块 或 驱动 器 的 i- 节点 


每 个 i- 节 点 编号 指向 i- 节 点 表 中 的 一 个 结构 。 i 一 节点 可 以 是 磁盘 文件 的 ,也 可 以 是 设 
备 文件 的 。i- 节 点 的 类 型 被 记录 在 结构 stat 的 成 员 变 量 st_mode 的 类 型 区 域 中 。 

磁盘 文件 的 i- 节点 包含 指向 数据 块 的 指针 。 设 备 文件 的 i 一 节点 包含 指向 内 核子 程序 
表 的 指针 。 主 设备 号 用 于 告知 从 设备 读 取 数 据 的 那 部 分 代码 的 位 置 。 

考虑 一 下 read 是 如 何 工作 的 。 内 核 首先 找到 文件 描述 符 的 i 一 节点 ,该 -节点 用 于 告诉 
内 核 文件 的 类 型 。 如 果 文 件 是 磁盘 文件 ,那么 内 核 通 过 访问 块 分 配 表 来 读 取 数据 。 如 果 文 
件 是 设备 文件 ,那么 内 核 通 过 调用 该 设备 驱动 程序 的 read 部 分 来 读 取 数据 。 其 他 的 操作 , 例 
如 open、write、lseek 和 close 等 都 是 类 似 的 。 


5.3 设备 与 文件 的 不 同 之 处 


磁盘 文件 和 设备 文件 都 有 文件 名 和 属性 ,从 表面 上 看 很 类 似 。 系 统 调用 open 用 于 创建 
与 文件 和 设备 的 连接 。 但 是 与 磁盘 文件 的 连接 不 同 于 与 终端 的 连接 。 图 5.2 显示 了 带 有 两 
个 文件 描述 符 的 进程 ,一 个 是 到 磁盘 文件 的 连接 , 另 一 个 是 到 终端 用 户 的 连接 。 





终端 文件 具有 回 
men WFE. i 
磁盘 文件 有 缓冲 区 “ 辑 和 换行 会 话 。 





图 5.2 拥有 两 个 文件 描述 的 进程 
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现在 已 经 了 解 了 一 些 关于 连接 的 内 部 情况 。 与 磁盘 文件 的 连接 通常 包含 内 核 缓冲 区 。 
从 进程 到 磁盘 的 字 节 先 被 缓冲 ,然后 才 从 内 核 的 缓冲 区 被 发 送出 去 。 磁 盘 连 接 具有 缓冲 这 
样 一 个 属性 。 到 终端 的 连接 则 不 同 ,进程 需要 尽快 把 到 终端 的 数据 传送 出 去 。 

与 终端 或 调制 解 调 器 的 连接 也 具有 属性 。 连 接 拥有 波 特 率 、 奇 偶 位 、 暂 停 位 的 个 数 。 一 
般 情 况 下 所 输入 的 字符 都 会 显示 在 屏幕 上 ,但 是 有 些 时 候 ,例如 当 输 入 密码 时 ,字符 并 不 回 
显 在 屏幕 上 。 回 显 字 符 不 是 键盘 任务 的 一 部 分 ,也 不 是 程序 应 该 做 的 ; 回 显 是 连接 的 一 个 属 
性 ,到 磁盘 文件 的 连接 没有 这 些 属性 。 


连接 属性 和 控制 


Unix 让 文件 和 设备 既 有 相似 之 处 ,又 有 不 同 之 处 。 与 磁盘 文件 的 连接 不 同 于 与 调制 解 
调 器 的 连接 。 关 于 连接 的 属性 可 以 问 : 

1. 连接 可 有 哪些 属性 ? 

2. 如 何 检测 当前 的 属性 ? 

3. 如 何 改变 当前 的 属性 ? 

下 面 介 绍 两 例 : 磁盘 连接 的 属性 和 终端 连接 的 属性 。 


5.4 ”人 磁盘 连接 的 属性 
系统 调用 open 用 于 在 进程 和 磁盘 文件 之 间 创 建 一 个 连接 。 该 连接 含有 若干 个 属性 ,下 
面 先 仔细 学 习 其 中 的 两 个 属性 ,然后 再 了 解 一 下 其 他 的 属性 。 
5.4.1 属性 1: 缓冲 


5.3 显示 了 当 两 个 管道 通过 一 个 进程 单元 连接 时 文件 描述 符 的 情况 。 那 个 进程 单元 
是 用 来 进行 缓冲 和 完成 其 他 进程 任务 的 。 在 方 框 内 的 是 控制 变量 ,用 以 决定 文件 描述 符 应 
该 采取 哪个 进程 步骤 。 







设置 文件 描述 符 控 
dA sich inet 


图 5.3 数据 流 中 的 进程 单元 


可 以 通过 修改 控制 变量 改变 文件 描述 符 的 动作 。 例 如 ,通过 简单 的 3 步 操 作 关 闭 磁 盘 绥 
冲 , 如 图 5.4 所 示 。 
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改变 驱动 器 设置 : 
1. 获 取 设 置 
2. 修 改 设置 
3. 存 储 设 置 





图 5.4 修改 文件 描述 符 的 运作 


首先 ,生成 一 个 系统 调用 将 控制 变量 从 文件 描述 符 复制 到 进程 。 然 后 ,修改 这 个 复制 过 
来 的 控制 变量 。 最 后 ,将 修改 过 的 值 送 回 内 核 。 新 的 设置 被 安置 在 进程 代码 中 ,内 核 根 据 新 
的 设置 处 理 数据 。 下 面 是 遵循 上 述 3 步 的 代码 : 


# include <fentl. h> 


int s; //settings 
s = fcntl (fd, F_GETFL); / /get flags 
s | = O SYNC; //set SYNC bit 
result = fcntl (fd, F_SETFL, s); //set flags 
if ( result == 1) = //if error 


perror ("setting SYNC"); / {report 


文件 描述 符 的 属性 被 编码 在 一 个 整数 的 位 中 。 系 统 调用 fent 通过 读 写 该 整数 位 来 控制 
文件 描述 符 。 


fentl 


目标 控制 文件 描述 符 
头 文件 # include <fentl. h> 
# include 一 unistd. h> 
# include — sys/types. h> 
函数 原型 int result — fcntl(int fd, int cmd) ; 
int result = fentl(int fd, int cmd, long arg); 
int result = fentl(int fd, int cmd, struct flock * lockp) ; 


参数 fd 需 控制 的 文件 描述 符 
cmd  ; 需 进 行 的 操作 
arg ”操作 的 参数 
lock “ 锁 信 息 

返回 值 =] 遇 到 错误 


other 依 操作 而 定 


fcntl 在 fd 所 指定 的 文件 上 执行 操作 cmd. arg 代表 操作 cmd 所 使 用 的 一 个 参数 。 在 上 
例 中 ,参数 F_GETFL 得 到 当前 的 位 集 (也 就 是 flags). EH s 存放 这 个 flag 集 。 位 逻辑 或 
操作 打开 位 O_SYNC。 该 位 告诉 内 核 , 对 write 的 调用 仅 能 在 数据 写 人 实际 的 硬件 时 才能 返 
回 , 而 不 是 在 数据 复制 到 内 核 缓冲 时 就 执行 默认 的 返回 操作 。 
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最 后 ,把 修改 过 的 设置 返回 内 核 。 将 F_SETFL 操作 作为 第 二 个 参数 ,将 修改 过 的 设置 
作为 第 三 个 参数 。 这 3 个 步骤 (从 内 核 中 读 取 设置 到 变量 ,修改 这 些 设置 ,将 设置 返回 内 核 ) 
是 Unix 中 读 取 和 修改 连接 属性 的 典型 方法 。 

设置 O_SYNC 会 关闭 内 核 的 缓冲 机 制 , 如 果 没 有 很 充分 的 理由 ， 最 好 不 要 关闭 缓冲 。 


5.4.2 属性 2: 自动 添加 模式 


文件 描述 符 的 另 一 个 属性 是 自动 添加 模式 (auto-append mode) 。 自 动 添加 模式 对 于 若 
干 个 进程 在 同一 时 间 写 和 文件 是 很 有 用 的 。 

为 什么 自动 添加 是 有 用 的 ? 

考虑 日 志文 件 wtmp。wtmp 存储 所 有 的 登录 和 退出 记录 。 当 一 个 用 户 登 录 时 ,程序 
login 在 wtmp 的 未 尾 追 加 一 条 登录 记录 。 当 一 个 用 户 退 出 时 ,系统 在 wtmp 的 末尾 追加 一 
条 退出 的 记录 ,如 同系 统 维护 的 日 记 一 样 。 这 就 像 人 们 写 日 记 一 样 , 每 篇 都 被 添加 在 末尾 。 

不 能 使 用 lseek 在 未 尾 进行 添加 记录 吗 ? 考虑 一 下 登录 的 逻辑 ,如 图 5. 5 所 示 。 


用 如 下 系统 调用 将 数据 
添加 到 文件 : 


lseek (fd,0,SEEK END); 
write (fd,&rec,len); 





图 5.5 FA Iseek 和 write 进行 添加 


lseek 将 当前 位 置 移 到 文件 的 末尾 ,然后 添加 登录 的 记录 。 这 里 会 产生 什么 错误 呢 ? 
如 果 两 个 人 同时 登录 将 会 发 生 什么 ? 含有 时 间 过 程 , 如 图 5. 6 所 示 。 


时 间 用 户 A 登录 用 户 B 登录 


e lseek(fd,0,SEEK END); 






a 

21 iseek(fd,0,SEEK_END) ; 
. 

3 è write(fG,&rec,len); 


41 write(fd,&rec,len); 


Y 


图 5.6 lseek 和 write 所 引起 的 混乱 


wtmp 文件 显示 在 中 间 ,时 间 箭 头 在 左边 ,并 显示 了 4 个 时 间 片 断 。 用 户 A 登录 的 代码 
显示 在 左边 ,用 户 也 登录 的 代码 显示 在 右边 。 到 现在 为 止 一 切 都 正常 吗 ? 一 个 重要 的 事实 











第 5 章 连接 控制 : 学 习 &tLy * 133 * 





是 ,Unix 昆 一 个 时 间 兴 享 系统 ,这 个 过 程 需要 两 个 独立 的 步骤 : lseek 和 write, 
现在 仔细 看 看 下 面 ， 

。 时 间 1. -8B 的 登录 进程 定位 文件 的 未 尾 

。 有 时 间 2 一 BB 的 时 间 片 用 完 ,A 的 登录 进程 定位 文件 的 末尾 

。 时 间 3— A 的 时 间 片 用 完 ,B 的 登录 进程 写 人 记录 

， 时 间 4—B 的 时 间 片 用 完 ,A 的 登录 进程 写 人 记录 

因此 ,A 的 登录 进程 写 人 的 记录 覆盖 了 B 的 记录 ,B 的 登录 记录 丢失 。 

这 种 情况 被 称 为 竞争 (race condition) 。 这 两 个 进程 所 共享 的 网 状 效应 依赖 于 这 两 个 进 
程 如 何 规划 。 在 时 间 方 面 做 一 个 小 的 改动 ,可 能 A 的 登录 记录 会 丢失 ,可 能 两 个 都 不 会 
ER, 

如 何 避 免 这 种 竞争 ? 有 很 多 方法 避免 竟 争 。 竞 争 是 系统 编程 所 面临 的 重要 问题 ,后 面 
需要 多 次 回 到 这 个 话题 。 在 这 个 特定 的 情况 中 ,内 核 提 供 一 个 简单 的 解决 办 法 ,自动 添加 模 
式 ， 当 文件 描述 符 的 O_APPEND 位 被 开启 后 ,每 个 对 write 的 调用 自动 调用 lecek HAA 
添加 到 文件 的 末尾 。 

下 面 的 代码 启动 自动 添加 模式 ,然后 调用 write, 


# include < fcntl. h> 


int s; //settings 
s = fentl ( fd, F GETFL); //get flags 
s |= O APPEND; //set APPEND bit 
result = fcntl ( fd, F_SETFL, sì; //set flags 
if ( result == -1) ¿iif error 
perror ( "setting APPEND"); // report 
else 
write (fd, &rec, 1); //write record at end 


术语 竞争 和 原子 操作 Catomoc operation) 8f 2] 4H 36. Xf Iseek 和 write 的 调用 是 独立 的 
系统 调用 ,内 核 可 以 随时 打 断 进程 ,从 而 使 后 面 这 两 个 操作 被 中 源 ， 当 0. APPEND 被 置 位 ， 
内 核 将 Iseek 和 write 组 合成 一 个 原子 操作 ,被 连接 戌 一 个 不 可 分 害 的 单元 。 


5.4.3 用 open 控制 文件 描述 符 


O SYNC 和 O. APPEND 是 文件 描述 符 的 两 个 属性 ,其 他 的 属性 将 在 后 面 的 章节 中 讨 
论 。fcntl 的 联机 帮助 列 出 了 你 的 系统 上 所 支持 的 所 有 选项 和 操作 。 

fentl 并 不 是 仅 有 的 用 来 设置 文件 描述 符 属性 的 方法 。 通 常 在 打开 一 个 文件 时 ,应 该 知 
道 需 要 怎样 的 设置 。 可 以 通过 系统 调用 open 的 第 二 个 参数 的 一 部 分 来 设置 文件 描述 符 的 属 
性 位 。 例 如 ,调用 : 





fd = open ( WTMP FILE, O WRONLY | O APPEND | O SYNC); 


以 写 方式 打开 文件 wimp 并 将 O APPEND f O. SYNC 位 开启 。open 的 第 二 个 参数 不 
REE ERE BHAE. 
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例如 ,可 以 通过 open 创建 一 个 包含 O_CREAT 标志 位 的 文件 。 以 下 两 个 调用 是 等 
价 的 : 


fd = creat ( filename, permission bits); 
fd = open ( filename, O CREAT | O TRUNC | O WRONLY, permission bits); 


为 什么 open 可 以 实现 相同 的 功能 ,而 creat 依旧 存在 ? 在 老 的 版 本 中 ,open 仅仅 用 来 打 
开 文 件 ,creat 用 来 创建 新 的 文件 。 随 后 ,open 被 多 次 修改 以 支持 更 多 的 标志 位 ,包括 创建 文 
件 选项 。 

open 支持 的 其 他 标志 位 : 


O CREAT 如果 不 存 在 ,创建 该 文件 。 可 查看 O EXCL, 
O TRUNC 如果 文件 存在 ,将 文件 长 度 置 为 0。 
O EXCL — O EXCL 标志 位 防止 两 个 进程 创建 同样 的 文件 。 如 果 文件 存在 且 0_EXCL 被 置 位 , 则 返回 - 1。 


O CREAT 和 O EXCL 的 组 合用 来 消除 以 下 竞争 情况 : 如 果 两 个 进程 同时 创建 相同 的 文 
件 将 会 发 生 什么 情况 ?例如 ,如 果 两 个 进程 都 要 写 wtmp, 但 是 这 个 文件 不 存在 时 ,都 要 创建 该 
文件 ,此 时 会 发 生 什 么 情况 ?程序 能 够 先 调用 stat 查看 文件 是 否 存 在 ,如 果 不 存 在 ,就 调用 
creat。 当 stat 和 creat 间 的 过 程 被 打 断 时 ,问题 就 出 现 了 。O_EXCL/O_CREAT 的 组 合 将 这 两 
个 调用 构成 了 一 个 原子 操作 。 虽 然 想法 很 好 ,但 是 这 种 方法 在 某 些 重要 场合 并 不 可 行 。 一 个 可 
靠 的 替代 方案 是 使 用 link。 本 章 的 练习 提供 了 一 个 例子 。 


5.4.4 磁盘 连接 小 结 


内 核 在 磁盘 和 进程 间 传 输 数 据 。 内 核 中 进行 这 些 传 输 的 代码 有 很 多 选项 。 程 序 可 使 用 
open 和 fcntl 系统 调用 控制 这 些 数 据 传输 的 内 部 运作 ,如 图 5. 7 所 示 。 





图 5.7 与 文件 的 连接 具有 属性 设置 
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5.5 终端 连接 的 属性 


系统 调用 open 在 进程 和 终端 之 间 创建 一 个 连接 。 现在 来 仔细 了 解 一 下 与 终端 连接 的 一 
些 属 性 。 


5.5.1 终端 的 1/0 并 不 如 此 简单 


终端 和 进程 之 间 的 连接 看 起 来 简单 。 通 过 使 用 getchar 和 putchar 就 能 够 在 设备 和 进程 
间 传 输 字 节 。 数据 流 的 这 种 抽象 使 得 键盘 和 屏幕 看 起 来 就 像 在 进程 中 一 样 ,如 图 5. 8 所 示 。 





图 5.8 一 个 简单 .直接 连接 的 流程 
一 个 简单 的 实验 表明 这 个 模型 并 不 完整 。 考 虑 以 下 这 个 程序 ， 


/* listchars.c 
* purpose; list individually all the chars seen on input 
* output: char and ascii code, one pair per line 
* input; stdin, until the letter Q 
* notes; usesful to show that buffering/editing exists 
x/ 
f include <stdio.h> 
main() 
{ 
int c, n = 0; 
while( ( c = getchar()) |= 'Q' ) 
printf("char &3d is &c code sd\n", n++,c,c); 
} 


这 个 程序 以 一 个 接 一 个 的 方式 处 理 字符 , 读 取 字符 ,打印 数值 .字符 本 身 以 及 它 的 内 部 
代码 。 编 译 并 运行 这 个 程序 ,结果 如 下 所 示 : 


$ ./listchars 
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hello 

char 0 is h code 104 
char 1 is e code 101 
char 2 is l code 108 
char 3 is 1 code 108 
char 4 is o code 111 
char 5 is 

code 10 

Q 

$ 


接 下 来 会 发 生 什么 事情 ? 如果 字 符 代码 直接 从 键盘 流向 getchar, 则 在 每 个 字符 后 可 看 
到 一 个 响应 。 输 入 单词 hello 中 的 5 个 字符 并 按 回 车 键 。 然 而 仅 在 这 个 时 候 , 程 序 才 开 始 处 
理 这 些 字符 。 输 入 看 起 来 被 缓冲 了 。 就 像 流向 磁盘 的 数据 ,从 终端 流出 的 数据 在 沿途 中 的 
某 个 地 方 被 存储 起 来 了 。 

listchars 显示 了 另外 一 些 内容 Enter Hak Return 键 通常 发 送 ASCII 码 13, 即 回 车 符 。 
listchars 的 输出 显示 ASCII 码 13 被 换行 符 ( 代 码 10) 所 替代 。 

第 三 种 处 理 影响 程序 的 输出 。listchars 在 每 个 字符 串 的 末尾 添加 一 个 换行 符 (\n) 。 换 
行 符 代码 告诉 鼠标 移 到 下 一 行 ; 但 没有 告诉 它 移 到 最 左边 。 代 码 13( 回 车 符 ) 告 诉 鼠 标 回 到 
REMO. 

运行 listchars 表明 在 文件 描述 符 的 中 间 必 定 有 一 个 处 理 层 。 图 5. 9 显示 了 该 层 的 部 分 
作用 。 












getchar putchar 









程序 发 送 "\n', 但 
是 显示 器 接收 到 
"rH RI n. 
用 户 输入 rs 
但 是 程序 接收 到 


‘\n', 







FA 5.9 内 核 处 理 终端 数据 


这 个 例子 说 明了 3 种 处 理 : 

1. 进程 在 用 户 输入 Return 后 才 接 收 数据 ; 

2. 进程 将 用 户 输入 的 Return(ASCII 83 13) 看 作 换 行 符 (ASCII 码 10); 
3. 进程 发 送 换 行 符 ,终端 接收 回 车 换行 符 。 


O 你 可 以 向 你 的 爷爷 请 教 如 何在 打字 机 上 推 左 侧 手柄 使 打字 头 回 到 纸 的 左边 。 
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与 终端 的 连接 包含 一 套 完 整 的 属性 和 处 理 步骤 。 
5.5.2 终端 驱动 程序 
终端 和 进程 之 间 的 连接 如 图 5. 10 所 示 。 





图 5.10 终端 驱动 器 是 内 核 的 一 部 分 


处 理 进程 和 外 部 设备 间 数 据 流 的 内 核子 程序 的 集合 被 称 为 终端 驱动 程序 或 tty 驱动 程 
序 。 了 驱动 程序 包含 很 多 控制 设备 操作 的 设置 。 进 程 可 以 读 , 修 改 和 重 置 这 些 驱 动 控 制 


5.5.3 stty 命令 


stty 命令 让 用 户 读 取 和 修改 终端 驱动 程序 的 设置 。 
(1) 使 用 stty 显示 驱动 程序 设置 
stty 的 输出 如 下 所 示 : 


$ stty 

speed 9600 baud; line = 0; 

$ stty - all 3 

speed 9600 baud; rows 15; columns 80; line = 0; 

intr = ^C; quit = ^X; erase = ^7; kill = ^U; eof = ^D; eol = <undef>; 
e012 = <undef>; start = ^Q; stop = ^S; susp = ^Z; rprnt = ^R; werase = ^W; 
lnext = ^V; flush = ^0; min = 1; time = 0; 

- parenb — parodd cs8 - hupcl — cstopb cread — clocal - crtscts 

- ignbrk brkint ignpar - parmrk — inpck istrip - inlcr - igncr icrnl ixon - ixoff 
— iuclc - ixany imaxbel 

opost ~ olcuc ~ ocrnl onlcr - onocr - onlret - ofill - ofdel n10 cr0 tab0 bs0 vt0 ff0 
isig icanon iexten echo echoe echok ~ echonl - noflsh — xcase — tostop - echoprt 





(D tty 是 指 由 Teletype 公司 生产 的 老式 打印 终端 。 
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echoctl echoke 





默认 选项 的 列表 很 简 清 。 如 加 上 选项 -all 则 将 列 出 更 多 的 设置 。 有 些 设 置 是 有 值 的 变 
量 , 有 些 是 布尔 值 。 例 如 , 波 特 率 和 屏幕 的 行 数 与 列 数 拥有 数值 。 像 intr、quit 和 eof 这 些 项 
拥有 字符 值 。 而 像 icrnl. -oleuc 和 onler 的 值 是 开 或 关 。 

这 些 意 味 着 什么 ?icrnl 是 Input:convert Carriage Return to NewLine( 输 入 时 将 回 车 转 
换 为 换行 ) 的 缩写 , 即 看 前 面 的 例子 中 睫 动 程序 所 做 的 操作 。 缩 写 onler 代表 Output;add to 
NewLine a Carriage Returnt 输 出 时 在 新 的 一 行 中 加 入 问 车 }。 一 个 属性 前 的 减 号 表示 这 个 
操作 被 关闭 。 例 如 , —olcuc 表示 动作 Output:convert LowerCase to UPpperCase( 输 出 时 将 小 
写字 母 转换 成 大 写 ) 被 禁止 dde HS 的 终端 只 显示 大写 字母, 所 以 那 时 将 输出 转换 成 大写 
很 有 用 。 

(2) 使 用 stty 改变 驱动 程序 设置 

这 里 是 -一 些 合 用 stty 修改 驱动 程序 属性 的 例子 ， 














$ stty erase X 和 make 'X' the erase key 
$ stty - echo # type invisibly 
$ stty erase (2 echo # multiple requests 


在 第 一 个 例子 中 ,使 用 suy 用 来 改变 删除 键 。 退 格 键 或 删除 键 是 典型 设置 ,但 是 可 以 将 . 
任何 键 作 为 圳 除 键 了 。 在 第 二 个 例子 中 ,关闭 按键 回 显 。 当 输入 密码 时 ,字符 并 不 回 显 在 屏 
幕 上 。 关 闭 这 个 回 显 意 昧 着 能 够 打字 ,但 是 看 不 到 所 输入 的 字符 。 在 第 三 个 例子 中 ,使 用 
sty 一 次 性 改变 多 种 设置 。 同 时 将 删除 键 疏 为 @, 并 将 回 显 模 式 开启 ， 

stty 如 何 运作 ? 现在 能 够 编写 stty T? 


5.5.4 编写 终端 驱动 程序 : 关于 设置 


tty 驱动 程序 包含 很 多 对 传人 的 数据 所 进行 的 操作 。 这 些 操作 被 分 为 4 种 ， 

， 输 入 : 驱动 程序 如 何 处 理 从 终端 来 的 字符 

。 输 出; 驱动 程序 如 何 处 理 流向 终端 的 字符 

， 控制, 字符 如 何 被 表示 一 -位 的 个 数 .位 的 奇偶 性 ,停止 位 等 

本地; 虹 动 程序 如 何 处 理 来 自 驱 动 程序 内 部 的 字符 

输入 处 理 包括 将 小 写字 母 转 换 为 大 写字 母 ,去 除 最 高 位 及 将 回 车 符 转 换 为 换行 符 ， 输 
出 处 理 包 括 用 若干 个 空格 符 代 替 制 表 符 ,将 换行 符 转换 为 四 车 符 及 将 小 写字 母 转换 为 大 写 
字母 。 控 制 设置 包括 奇偶 性 及 停止 位 的 个 数 。 本 地 处 理 包 播 同 显 字符 给 用 户 及 缓冲 输入 直 
到 用 户 按 回 车 键 。 

除了 于 和 关 设 置 外 ,驱动 程序 维护 了 一 张 含 有 特殊 意义 键 的 列 硼 。 例 如 ,用 户 可 能 按 退 
格 键 来 删除 一 个 字符 。 终 端 驱动 程序 会 注意 并 处 理 这 个 删除 键 。 除 此 之 外 ,终端 驱动 程序 
还 负责 对 其 他 一 些 控制 字符 进行 处 理 。 

联机 帮助 上 列 出 了 stty 大 部 分 的 设置 和 控制 字符 。 








出 部 分 Unix shell 处 型 此 命令 PRE REL JEFE FERE IR IEEE BE ,而 不 在 驱动 程序 中 处 理 此 命令 。 
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5.5.5 编写 终端 驱动 程序 : 关于 函数 


改变 终端 驱动 程序 的 设置 就 像 改 变 磁盘 文件 连接 的 设置 一 样 : 
(1) 从 驱动 程序 获得 属性 ; 

(2) 修改 所 要 修改 的 属性 ; 

(3) 将 修改 过 的 属性 送 回 驱动 程序 。 

例如 ,以 下 代码 为 一 个 连接 开启 字符 回 显 : 


# include — termios. h> 


struct termios attribs; /* struct to hold attributes */ 
tcgetattr ( fd, &settings); /* get attribs from driver x/ 
settings.c lflag | = ECHO; /* turn on ECHO bit in flagset */ 


tcsetattr ( fd, TCSANOW, &settings); /* send attribs back to driver x/ 


通常 的 过 程 在 图 5. 11 中 进行 描述 。 


f include <termios. h> 
struct termios settings; 
tcgetattr(fd,&settings); 


/* test, set, or 
clear bits */ 


tcsetattr(fd, how, &settings); 





图 5.11 调用 tcgetattr 和 tesetattr 控制 终端 驱动 器 


PE PRI tcgetattr 和 tcsetattr 提供 对 终端 驱动 程序 的 访问 。 两 个 函数 在 termios 结构 中 
交换 设置 。 以 下 是 详细 描述 。 





tegetattr 

目标 读 取 tty 驱动 程序 的 属性 
头 文件 # include 一 termios. h> 

# include — unistd, h> 
函数 原型 int result — tcgetattr(int fd, struct termios x info); 
参数 fd 与 终端 相 联 的 文件 描述 符 

info 指向 终端 结构 的 指针 
返回 值 ni 遇 到 错误 

0 成 功 返 回 


一  eeesSSSSsSsSS— 
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tcgetattr 从 与 文件 fd 相关 的 终端 驱动 程序 中 获取 当前 设置 ,并 把 它 复制 到 info 指针 所 























指 的 结构 中 。 
tesetatir 
AR) ,, Hy Boy FEF BUDE 
Aif # include «termios, h> 
mE # include <unistd. h> . 
2 Er ud int result = tcsetattr(int fd, int when, struct termios # info); 
参数 id 133 85 HR HEEK I Sc CERTE 
when 改变 设置 的 时 间 
info 指向 终端 结构 的 指针 
返回 值 一 1 通 到 错误 
Q 成 功 返 回 





tesetattr 从 info 所 指 的 结构 中 将 驱动 程序 的 设置 复制 到 与 文件 fd 相关 的 终端 驱动 程序 
"P. when 参数 告诉 tesetattr 在 什么 时 候 更 新 驱动 程序 设置 。when 的 允许 值 如 下 所 示 。 

(1) TCSANOW 

立即 更 新 驱动 程序 设置 。 

(2) TCSADRAIN 

等 待 直到 驱动 程序 队列 中 的 所 有 输出 都 被 传送 到 终端 。 然 后 进行 驱动 程序 的 更 新 。 

(3) TCSAFLUSH 

EFE EL Bl Se oS FE BÀ P0 cp B9 BEC 3s AR RSH MA. EUG ERA DR A AGE 
据 , 并 进行 一 定 的 变化 。 


5,5.6 编写 终端 驱动 程序 : 关于 位 
termios 结构 类 型 包括 车 于 个 标志 集 和 一 个 控制 字符 的 数组 。 所 有 的 Unix 版 本 包含 以 





struct termios 


{ 


teflag_t c iflag; /* input mode flags x/ 
tcflag t c oflag; /* output mode flags x/ 
tcflag t c cflag; /* control mode flags x/ 
tcflag t c lflag; /* local mode flags «/ 
cc t c ec[NCCS]; /« control characters x/ 


speed t c ispeed; /x input speed x/ 
speed t c ospeed;: /* output speed af 
E 


AASB BU FE FE E H BO HAS DE D DERE ETE c_ispeed 和 c. ospeed 成 员 中 。 
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SETS SER OH fr PR CREE 5. 12 所 示 。 


c iflag 
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OzvrizZ BATZ 
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zë $ © FE 2 SE a 
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m 


图 5.12 终端 变量 中 的 位 和 宰 符 


首先 描述 的 4 个 成 员 是 标志 集 。 每 个 标志 集 包含 在 该 组 中 的 操作 位 。 例如, 成员 c_iflag 
HE INLCR 值 的 位 。 成 员 c_cflag RBM PARODD 的 值 ,其 功能 是 设置 奇偶 性 。 所 有 这 
些 掩 码 都 定义 在 termios, b 中 。 如 从 驱动 程序 中 读 取 当前 的 属性 到 termios 结构 中 时 ,这 个 
结构 中 的 所 有 值 都 可 以 被 检验 和 修改 。 

成 员 c cc 是 控制 字符 的 数组 。 含 有 特殊 功能 的 键 都 被 存储 在 这 个 数组 中 。 数 组 中 的 每 
个 位 置 都 由 termios. h 中 的 常量 所 定义 。 例 如 ,attribs, ec_ceLVERASE] = Ab' 告 诉 驱动 程 
序 将 退 格 键 作 为 删除 键 。 

现在 已 经 知道 如 何 从 驱动 程序 获得 设置 和 和 如何 将 设置 存 回 驱动 程序 ,下 面 看 看 修改 驱 
动 程序 属性 的 技术 。 . 

每 个 属性 在 标志 集中 都 占有 一 位 。 属 性 的 掩 码 定义 在 termios. h 中 。 要 测试 一 个 属性 ， 
需要 将 标志 和 集 与 那个 位 的 挤 码 柑 与 。 要 启动 这 个 属性 ,将 该 位 开启 。 要 禁止 这 个 属性 ,将 该 
位 关闭 。 上 面 的 情况 如 下 所 示 : 
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操作 & 码 

和 测试 位 if C flagset 必 MASK)... 
a flagset | — MASK 

清除 位 i flagset & = ~MASK 


5.5.7 编写 终端 驱动 程序 : 几 个 程序 例子 


l. f-F: echostate. c—— ERE BAHAR A 
第 一 个 例子 说 明 终 端 是 否 被 设置 成 回 显 字 符 的 模式 。 读 取 设 置 ,测试 位 ,并 报告 结果 : 


/* echostate.c . 
* reports current state of echo bit in tty driver for fd 0 
* shows how to read attributes from driver and test a bit 
sf 
#4 include — «Lstdio. h> 
# include — «—termios.hc 
main() . 
i 
struct termios info; 


int rv; 


rv = tcgetattr( 0, &info J; /* read values from driver */ 
if (rv == -1}{ 

perror( "togetattr"); 

exit(1); 


1 
了 


if ( info.c lflag & ECHO ) 
printf(" echo is on , since its bit is 1Xn") ; 
else 
printf(" echo is OFF, since its bit is 0\n"); 


} 


这 个 程序 为 文件 措 述 符 0 读 取 终端 属性 。0 是 标准 输入 的 文件 描述 符 ,该 文件 描述 符 通 
常 附 属 在 键盘 上 。 这 里 是 编译 和 运行 程序 的 一 个 例子 : 





$ cc echostate.c 一 口 echostate 
S ./echostate 

echo is on, since its bit is 1 
$ stty - echo 

s ./echostatr: not found 


§ echo is OFF, since its bit is 0 





这 个 例子 显示 命令 stty -echo 关闭 驱动 器 里 的 击 键 问 显 。 用 户 在 这 之 后 输入 了 另外 两 
个 命令 ,但 它们 在 屏幕 上 并 不 显示 。 另 一 方面 ,对 那 两 行 的 输出 响应 仍然 显示 。 
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2. 例子， setecho.c Ew BAA 
第 二 个 例子 将 键盘 回 旺 开 或 关 。 如果 命 令 行 参数 以 “y" 开 始 ,终端 的 回 显 标志 被 开启 


UE SAL. FEAR ROE Ara: 











/* setecho.c 
* usage: setecho [yjn] 
* shows; how to read, change, reset tty attributes 


xf 
Hinclude <stdio.h> 
Finclude << termios. h= 


ftdefine cops(s,x) | perror(s); exit(x}; ! 


main(int ac, char * av[ D) 


struct termios info; 


if (ac == 13 
exit(0); 
if ( tcgetattr(0,&info) == -1)j /* get attribs */ 
oops("togettattr", 1); 
if CavLijio! == ty?) 
info.c lflag | = ECHO ; /* turn on bit «/ 
else 
info.c_iflag&= -—-ECHO ; /* turn off bit «/ 
if ( tesetattr(0,TCSANOW,&info) == 1) /* set attribs «/ 


oops("tcsetattr" 2); 
f 


测试 并 运行 这 两 个 程序 以 及 正常 模式 下 的 stty: 


$ echostate; setecho n ; echostate ; stty echo 
echo is on, since its bit is 1 

echo is OFF, since its bit is 0 

$ stty - echo; echostate ; setecho y ; setecho n 


echo is OFF, since its bit is 0 


在 第 一 个 命令 行使 用 setecho RMA. RAHA sty 将 回 显 重新 开启 。 驱 动 程序 和 
驱动 程序 设置 被 存 情 在 内 核 ,而 不是 在 进程 。 一 个 进程 可 以 改变 驱动 程序 里 的 设置 , 另 一 个 
不 同 的 进程 可 以 读 取 或 修改 设置 。 

3. fi showtty.c 显示 大 量 驱 动 程序 属性 

可 以 重复 用 setecho. c 和 echestate. c 中 的 技术 建立 一 个 完整 的 stty 版 本 。tty 驱动 程序 
包 会 3 种 设置 : HARSH .数值 和 位 。showtty 包 售 显 示 这 些 数据 类 型 的 函数 。 以 下 是 代码 ， 








fs showtty.c 
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* displays some current tty settings 


+f 


# include <(stdio. h> 
include «< termios. h> 


maint) 
{ 
struct termios ttyinfo; /* this struct holds tty info x/ 
if ( tegetattr( 0 , &ttyinfo ) == -1H /* get info x/ 
perror( "cannot get params about stdin") : 
exit(1>; 
} 
/* show info x/ 
showbaud ( cfgetospeed( &ttyinfo ) 5; /* get + show baud rate «/ 


printf ("The erase character is ascii € d, Ctrl- *c\n", 
ttyinfo.c cc[VERASE], ttyinfo.c cc[VERASE]- 1 * 'Ar); 
printf("The line kill character is ascii * d, Ctrl- * cin", 
ttyinfo.c ce[VKILL], ttyinfo.c cc[VKILL] - 1+ 'A*5; 
show some flagst &ttyinfa }; /* show misc. flags */ 
} 
showbaud( int thespeed } 
/* 
* prints the speed in english 
xf 
{ 
printf( "the baud rate is "); 
Switch ( thespeed }{ 
case B300; printf("300\n"); break; 
case B600; printf("600\n"); break; 
case B1200; printf("1200\n"); break; 
case B1800: printf("1800Xn'0 ; break; 
case B2400; printf("2400Xn"); break; 
cese B4800. printf("4800\n"); break; 
case B9600; printf("9600Xn") ; break; 
default: printf("Fastin") ; break; 


} 


struct flaginfo | int fl value; char x» fl name; }; 


struct flaginfo input flags[] = | 


ICNBRK , "Ignore break condition", 
BRKINT , "Signal interrupt on break", 
IGNEAR , "Ignore chars with parity errors "| 


PARMRK "Mark parity errors", 
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INPCK "Enable input parity check", 


r 


ISTRIP , "Strip character", 


INLCR , "Map NL to CR on input", 

IGNCR , "Igore CR", 

ICRNL , "Map CR to NL on input", 

IXON , "Enable start/stop output control", 

/* IXANY , "enable any char to restart output", »/ 
IXOFF , "Enable start/stop input control", 

D NULL }; 


F 


struct flaginfo local flags| | = | 
l ISIG, "Enable signals", 
ICAHON , "Canonical input (erase and kill)", 
/* XCASE , “Canonical upper/lower appearance", »/ 
ECHO , "Enable echo", 
ECHOE , "Echo ERASE as BS - SPACE — BS", 
ECHOK , "Echo KILL by starting new line", 


0 NULL ); 


t 


show some flags( struct termios * ttyp ) 

fx 
* show the values of two of the flag sets ; c iflag and c lflag 
* adding c oflag and c cflag is pretty routine — just add new 
* tables above and a bit more code below. 


f 


show flagsett ttyp —-c iflag, input flags ); 
show flagset( ttyp — c lflag, local flags ); 
} 
show flagset( int thevalue, struct flaginfo thebitnames[! } 
ja 
x check each bit pattern and display descriptive title 
xf 
( 
int i; 


for ( i-0; thebitnames| i].fl value ; 


F 


att i 

printf( " sis ", thebitnames| i].f1 name); 

if ( thevalue & thebitnames[ i].fl value ) 
printf("QONn"); 

else 


printf("OFFXÁn"); 
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showtty Hisk td zs HK afi Fe FF RU 16 个 属性 的 当前 状态 ,并 附 有 注释 。 程序 使 用 了 结构 表 
以 简化 代码 。 一 个 简单 的 函数 show_flagset 接收 一 个 整数 和 驱动 程序 标志 集 。 如 在 这 个 程 
序 中 增加 其 他 的 标志 集 需 要 些 什么 呢 ? 将 这 个 程序 转换 成 完整 版 本 的 stty 需要 些 什 么 呢 ? 


5.5.8 终端 连接 小 结 


终端 是 人 们 用 来 和 Unix 进程 进行 道 信 和 的 设备 。 终 端 拥有 一 个 可 以 让 进程 恋 取 字符 的 
键盘 和 可 让 进程 发 送 宁 符 的 显示 器 。 终 端 是 一 个 设备 ,所 以 它 在 目录 树 中 表现 为 一 个 特殊 
的 文件 ,通常 在 /dev 这 个 目录 中 。 

进程 和 终端 同 的 数据 传输 和 数据 处 理 出 终端 驱动 程序 负责 ,终端 驱动 程序 序 是 内 核 的 一 
部 分 。 该 内 核 代 码 提供 缓冲 .编辑 和 数据 转换 。 程 序 可 通过 调用 tcgetattr 和 tesetattr 查看 
和 修改 该 驱动 程序 的 设置 ， 


5.6 其 他 设备 编程 ; ioctl 


到 磁盘 文件 的 连接 有 一 个 属性 集 , 到 姐 端 的 连接 有 另外 一 个 属性 集 。 到 其 他 类 型 设备 
的 连接 是 怎样 的 呢 ? 

考虑 CD 刻录 机 。 可 氛 写 的 CD BRM AR, BELA ARES CD。 扫 描 仪 有 
自己 的 设置 ,如 解析 度 和 颜色 深度 等 。 其 他 类 型 的 设备 有 各 自 的 属性 集 。 程 序 员 如 何 查看 
和 控制 一 个 设备 的 设置 呢 ? 

每 个 设备 文件 部 支持 系统 调用 ioctl: 
-~ OUO 









































ioctl 

目标 控制 一 个 设备 
ix + include << sys/ioctl. hz 
eR S Ie 3 int result = ioctl Cint fd, int operation [. arg... ] ); 
参数 fd 与 设备 相 联 的 交 件 描述 符 

operation fe EAP ARTE 

arg... 操作 所 天 参数 
返回 值 一 1 RFR 


other TA d E 





系统 调用 ioct] 提供 对 连接 到 fd 的 设备 驱动 程序 的 属性 和 操作 的 访问 。 每 种 类 型 的 设 
备 都 有 自己 的 属性 集 和 ioctl ER. 

例如 ,一 个 终端 屏幕 ,有 一 个 以 行 和 列 或 者 是 以 像素 为 单位 的 大 小 属性 。 下 面 的 代码 显 
示 有 屏幕 的 尺寸 。 





# include <Zsys/ioctl. hz» 
void print screen dimensions() 
1 


struct winsize wbuf; 
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if ( ioctl ( 0, TIOCGWINSZ, &wbuf) |= -1){ 
printf ("%d rows x *&d colsXn", wbuf.ws row, wbuf.ws col); 


printf ("%d wide x $d tallin", wbuf.ws xpixel, wbuf.ws ypixel); 


! 


符号 TIOCGWINSZ 是 函数 代码 ,wbuf 的 地 址 是 该 设备 控制 函数 的 参数 。 

阅读 头 文 件 是 了 解 设备 类 型 以 及 相关 函数 的 好 方法 。 联 机 帮助 中 有 关 没 备 的 内 容 也 包 
括 属 性 和 函数 的 列表 。 例 如 ,Linux 中 有 关 st(4) 的 联机 帮助 讲述 了 使 用 ioet] 控制 SCSI 磁 
带 驱 动 器 的 细节 。 


5.7 文件 .设备 和 流 


任何 数据 的 源 或 日 的 地 都 被 Unix 视 为 文件 。 基 本 的 系统 调用 既 适 用 于 磁盘 文件 也 同 
样 适用 于 设备 文件 ,它们 的 区 别 体 现在 对 连接 的 操作 上 。 磁 盘 文 件 的 文件 描述 符 包 含 对 组 
冲 属 性 和 扩展 属性 的 定义 代码 。 终 端的 文件 描述 符 包含 编辑 . 回 显 .字符 转换 和 其 他 操作 的 
RPE Ee XR, 

可 以 把 每 个 处 理 步 豫 描 述 成 连接 的 一 个 属性 ,但 是 反 过 来 说 ,连接 也 可 以 看 作 是 处 理 步 
又 的 组 合 ，20 世纪 80 年 代 由 AT&T 开发 的 一 个 Unix 版 本 System V 建立 了 一 个 以 处 理 序 
列 为 基础 的 数据 流 模 型 。 这 有 点 像 清 洗 汽 车 。 首 先 ,将 肥皂 水 酒 在 车 上 。 然 后 用 大 刷子 擦 
去 艾 尘 。 下 一 步 , 用 高 压 软 管 将 表面 的 肥皂 泡沫 和 灰尘 清除 ,同时 使 用 车 盟 锈 抑制 剂 , 打 上 
TRA. usb IRE E. Ern uq ISTE. 

当然 ,每 个 步 又 都 是 汽车 清洗 者 从 汽车 清洗 公司 买 来 部 件 完成 的 ， 买 来 之 后 把 它们 安 
置 在 清洗 序列 中 的 某 个 位 署 ,整个 系统 就 可 以 工作 了 。 而 且 , 可 以 进行 重组 和 改造 ,比如 省 
BR SE RE Se BE RE EO EE 

这 是 数据 流 模 型 和 连接 属性 的 流 模型 的 一 个 大 概 的 想法 。 流 模型 的 一 个 重要 特征 是 处 
理 的 模块 化 。 如 果 不 满意 仅 能 支持 像 大 小 写 转 换 这 样 的 终端 驱动 程序 ,可 以 设计 并 安装 一 
个 可 将 数字 转换 成 罗马 数字 的 模块 。 也 就 是 ,可 以 编写 一 个 能 完成 从 阿拉 伯 数 字 到 罗马 数 
字 转 换 的 处 理 模 块 。 将 它 写 到 流 模型 规范 ,然后 使 用 特殊 的 系统 调用 将 该 模块 安装 类 系统 
上 。 流 数据 经 过 它 的 处 理 就 从 阿拉 伯 数 字 变 成 罗马 数字 了 。 

在 联机 帮助 上 查看 streamio 以 了 解 更 多 关于 通过 这 种 方式 管理 连接 属性 问题 的 解决 方 
案 。 在 某 些 版 本 的 Unix 中 , 流 用 来 实现 网 络 服务 . 


小 结 








1, 主要 内 容 

* FECE BERS AD VASE HER (Al S5 d 3 GE SERE HERE QUE E RC PE .终端 和 外 部 设备 ( 像 打 
印 机 .磁带 驱动 器 .声卡 和 鼠标 ) 。 到 磁盘 文件 和 终端 的 连接 有 相似 之 处 但 也 有 差异 ， 

* 磁盘 文件 和 设备 文件 都 有 名字 、 属 性 和 权限 位 。 标 准 文 件 系统 调用 open, read, 
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write,close 和 lseek 可 被 用 于 任何 文件 或 设备 。 文 件 权限 位 以 同样 的 方式 应 用 于 控 
制 设备 文件 和 磁盘 文件 的 访问 。 

。 到 磁盘 文件 的 连接 在 处 理 和 传输 数据 方面 不 同 于 到 设备 文件 的 连接 。 内 核 中 管理 与 
设备 连接 的 代码 被 称 为 设备 驱动 程序 。 通 过 使 用 fcntl 和 ioctl, 进 程 可 以 读 取 和 改变 
设备 驱动 程序 的 设置 。 

。 到 终端 的 连接 是 如 此 的 重要 ,以 至 函数 tcgetattr 和 tcsetattr 专门 用 来 提供 对 终端 驱 
动 器 的 控制 。 

* Unix 命令 stty 使 得 用 户 能 够 访问 tcgetattr 和 tcsetattr 函数 。 

2. 图 示 

进程 使 用 write 将 数据 写 入 文件 描述 符 , 用 read 从 文件 描述 符 读 出 数据 。 文 件 描 述 符 可 

被 连接 到 磁盘 文件 ,终端 和 外 部 设备 。 文件 描述 符 指 向 设备 驱动 程序 时 ,设备 驱动 程序 具有 
属性 设置 ,如 图 5. 13 所 示 。 





5.13 文件 描述 符 、 连 接 和 驱动 器 


3. 下 一 章 的 内 容 
从 磁盘 读 取 数 据 相对 容易 ,但 是 从 用 户 终 端 读 取 有 点 麻烦 ,因为 人 是 不 可 预知 的 。 需 要 
用 户 输入 数据 的 程序 可 以 利用 终端 驱动 器 的 一 些 特别 的 连接 控制 功能 。 在 下 一 章 中 将 详细 
了 解 一 些 有 关 用 户 程序 编写 方面 的 主题 。 
4. 习题 
5.1 在 一 个 Linux 机 器 上 ,很 容易 读 取 鼠标 的 输出 。 做 这 个 工作 需要 处 于 文本 模式 。 
在 shell 中 ,确保 称 为 gpm 的 程序 不 在 运行 : 输入 gpm -k。 然 后 ,输入 cat /dev/ 
mouse。 然 后 移动 鼠标 并 按键 。 命 令 cat 从 设备 文件 中 读 取 数 据 。 从 该 文件 读 取 
的 字 节 是 鼠标 产生 的 按键 次 数 和 移动 消息 。 


5.2 设备 文件 中 的 执行 位 是 什么 意思 ? 学 习 命令 biff, 考 虑 这 个 位 的 作用 。 


5.3 前 面 已 经 讨论 了 设备 文件 的 输入 /输出 如 何 运作 。 那 么 像 Ih、mv 和 rm 等 的 目录 
操作 如 何 运 作 呢 ? 利用 图 5. 1, 解 释 这 三 个 命令 是 如 何 影 响 目录 、i- 节 点 和 了 驱动 程 
序 的 。 
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un 


命令 rm 和 系统 调用 unlink 删除 与 i- 节 点 的 一 个 链接 。 如 果 该 i- 节点 的 链接 数 
降 为 0, 则 内 核 释 放 磁 盘 块 和 ii- 节点。 设备 i- 节点 没有 分 配 列 表 和 数据 块 。 取 而 
代 之 的 是 设备 文 伴 的 i- 节 点 包 会 指向 内 核 设备 驱动 子 程序 的 指针 。 如 果 删 除 设 
备 的 文件 名 , 则 内 核 释 放 i- 节 点 ,驱动 程序 仍旧 在 内 核 中 。 如 何 新 创建 一 个 文件 
连接 铬 该 设备 呢 ?《 提 示 : 阅读 mknod) 


考虑 为 文件 添加 内 容 时 的 竟 争 情况 。 前 文中 的 讨论 描述 了 一 个 可 能 的 顺序 。 这 
两 个 进程 每 个 进程 有 两 个 操作 ,那么 有 多 少 种 顺序 组 合 的 可 能 性 呢 ? 每 种 顺序 的 
结果 是 什么 ? 


查看 Linux 内 核 代码 , 找 出 O_APPEND 位 是 在 和 何 处 被 校 验 的 。 自 动 定 位 是 如 何 
实现 的 ? 


系统 调用 rename 是 个 原子 操作 。 在 这 个 单一 的 调用 中 合并 了 哪些 步骤 呢 ? AS 
Unix 的 内 核 代 码 , 以 了 解 所 有 的 竞争 情况 和 内 核 处 理 的 可 能 冲突 。Linux 代码 中 
的 解释 有 些 饶 舌 和 有 趣 。 


Pro FE ESSE fopen 支持 以 添加 模式 打开 文件 。 例 如 ,fopen C"data", "a'0, FER 
的 系统 上 ,这 是 通过 添加 模式 开启 O_APPEND, 还 是 仅仅 在 打开 文件 后 定位 文件 
的 末尾 来 实现 的 呢 ? 找到 fopen 的 源 代 码 , 或 者 编写 一 个 程序 添加 模式 两 次 打开 
同一 个 文件 ,然后 交 震 向 两 个 流 写 数据 。 根 据 所 发 生 的 现象 能 得 到 和 什么 结论 ? 


PITE echostate. c 报告 文件 描述 符 0 表示 的 驱动 器 回 显 位 的 状态 。 使 用 重 定向 符 
“于 "将 标准 输 人 定向 到 其 他 的 文件 或 设备 。 尝 试 以 下 试验 : 

echostate < /dev/tty 

echostate < /dev/lp 

echostate < /etc/passwd 


echostate < 'rtty! 


说 出 每 个 命令 行 的 输出 。 


.10 程序 setecho 改变 附加 在 标准 输入 的 驱动 程序 的 回 显 位 。 如 果 将 标准 输 人 重 定 


向 到 一 个 不 局 的 终端 ,就 可 以 改变 该 终端 的 回 显 位 。 

尝试 以 下 试验 。 

(1) 在 同一 各 机 器 上 登录 2 次 (或 在 机器 土 打 开 2 个 窗口 )， 

(2) ESTAS PHA tty,; 以 找到 那 两 个 窗口 的 设备 文件 和 名。 假设 一 个 连接 到 / 
dev/ttyp1; 另 一 个 连接 到 /dev/ttyp2。 

(3) 在 ttypl, 输 入 setecho n < /dev/ttyp2. 

(4) 在 ttyp2 AO RATS echostate, 

(5) 然后 在 ttyp1, 输 入 echostate < /dev/ttyp2, 

(6) 解释 发 生 的 情况 。 

(7) 用 命令 suy 向 同样 的 试验 。 
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可 能 有 -- 天 ,你 会 发 现 这 个 功能 的 确 很 有 用 。 


前 文中 的 例子 为 tcgetattr 和 tesetattr 调用 使 用 的 文件 描述 符 的 值 为 0。 第 一 个 
参数 是 文件 描述 符 ,也 可 以 是 任何 指向 到 终端 设备 连接 的 值 。 

文件 措 述 符 1 指向 标准 和 输出。 修改 echostate 和 setecho ,使 用 文件 描述 符 1 代替 
09。 这 个 变化 如 何 影响 程序 的 执行 ? 通常 标准 输入 和 标准 输出 指向 终端 。 解 释 
echostate > echostate. log EFIA? 使 用 文件 描述 符 0 AHA EL Sb? 





如 果 想 建立 -个 接收 ppp 连接 的 系统 ,需要 安装 一 个 调制 解 调 器 ,并 且 配 置 串 行 
端口 。 串 行 接 上 的 终端 驱动 程序 应 该 被 配置 成 能 和 调制 解 调 器 协同 工作 。 阿 污 
X ff /etc/gettydefs M/ete/inittab, FY Unix MM HEB LM ERE LK 
Wait E. 


有 些 Unix 支持 三 种 版 本 的 O SYNC; 仅 数据 块 , 仅 i- 节点 和 两 者 都 是 。 为 什么 
需要 确保 以 某 种 方式 写 人 ? 控制 这 3 种 类 型 的 标志 的 各 各 是 什么 ? 

















在 一 个 终端 特殊 文件 上 的 读 和 和 写 的 权限 位 用 来 控制 什么 ? 使 用 tty 确定 你 的 终 
端的 名 字 ,然后 使 用 chmod 000 /dev/yourtty 将 你 的 终端 设置 成 对 你 来 说 也 不 可 
读 。 此 时 发 生 了 秆 么 情况 ?为 什么 呢 ? 


查看 你 系统 上 的 /qdev 目录 ,找到 不 支持 read 操作 的 文件 ,不 支持 write 操作 的 文 
件 以 及 不 支持 lseek 操作 的 文件 。 





在 /dev 中 使 用 1s -1 找到 各 种 设备 的 最 大 数目 和 妃 小 数目 。 你 看 到 了 什么 模式 ? 
什么 设备 县 有 同样 的 最 大 数目 ?这 些 设 备 有 什么 共同 点 ?它们 如 何 区 分 ? 





为 tty 驱动 器 设置 的 4 个 组 命名 。 解 释 每 个 组 的 月 的 ,并 在 每 个 组 中 命名 两 
个 位 。 


程序 使 用 tesetattr 关闭 当前 终端 的 问 显 模 式 。 当 那个 程序 存在 ,终端 处 于 无 回 
显 状态 。 另 -方面 , 当 程 序 打开 一 个 文件 并 使 用 fcntl 将 描述 符 置 于 O. APPEND 
模式 ,下 一 个 打开 这 个 文件 的 程序 不 能 获得 自动 添加 模式 。 解 释 这 个 明显 的 不 
RHAN. 


到 终端 的 连接 是 个 正规 的 文件 猫 述 符 。 你 能 够 使 用 fentl 为 与 文件 描述 符 的 连接 
设置 O_APPEND 属性 吗 ? 自动 添加 对 设备 来 说 是 什么 意思 ? 





ioctl 和 fent 间 的 区 划 是 什么 ? 


H3 /dev (i X fF /dev/nall 和 /dev/zero。 这 些 文件 并 涉 是 到 设备 的 连接 ,但 是 
它们 也 并 不 代表 位 盘 文 件 。 这 些 文件 是 用 来 做 什么 的 ? 为 什么 它们 是 有 用 的 ? 
Tr RE SE TE / dev 月 录 中 找到 虚拟 设 符 的 其 他 文件 吗 Le (x PAP ERE 
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9. Hy 422% 3 


5. 22 


5. 25 


改进 这 章 中 write 的 简单 版 本 。 前 文中 的 版 本 要 求 用 户 输入 设备 文件 名 ,而且 该 
版 本 并 不 显示 不 同 的 欢迎 用 语 。 编 当 一 个 新 版 本, 能 够 接受 用 户 名 作为 参数 ,于 
在 屏幕 上 显示 你 想 通 信 的 骨 户 。 查 看 write 的 标准 版 本 显示 的 内 容 。 

你 的 程序 应 该 可 以 处 理 这 样 的 特殊 情况 ; 你 想 聊 大 的 人 可 能 没有 登录 。 另 - 方 
而 :你 想 孵 天 的 人 可 能 登录 了 若 十 个 终端 。 











不 想 被 那些 发 送 write 的 人 打扰 的 用 户 可 以 使 用 命令 mesg. [GE mesg, 通 过 程 
序 试验 以 了 解 它 如 何 工作 ,然后 写 一 个 这 样 的 程序 。 


通常 的 竟 争 情况 包括 两 个 进程 同时 更 新 邮 一 个 文件 。 合 如 , 当 你 在 一 些 系 统 上 
修改 你 的 密码 ,程序 passwd 重 写 文 件 /'etc/passwd。 如 果 两 个 用 户 同 时 修改 他 们 
的 密码 会 怎样 昵 ? 
一 种 防止 对 一 个 文件 进行 同时 访问 的 方法 是 利用 系统 调用 link 的 一 个 重要 性 
E, SBA PAR: 
rA 

* tries to make a link called /etc/passwd, LCK 








* returns 0 if ok, 1 if already locked, 2 if other problem 
LE 
int lock_passwd(} 


了 
1 


int rv = 0; . f* default return value «/ 
if ( link ("/etc/passwd", "/etc/passwd.LCK") == - 1) 
rv = ( errno == EEXISTS ? 1 ;2 5; 
return rv; 
} 
(1) 如 本 两 个 进程 在 同一 时 刻 执行 这 段 代码 ,只 有 一 个 会 成 功 ， 系 统 调用 link 如 
何 使 用 有 效 的 方法 给 文件 上 锁 ? 
(2) 使 用 这 种 方法 编写 一 个 程序 ,将 文本 的 一 行 添 加 到 一 个 文件 。 你 的 程序 需要 
尝试 建立 链接 。 如 果 链 接 成 功 ,程序 能 够 打开 文件 ,添加 行 ,然后 柚 除 链接 ， 
如 果 建 站 链接 失败 ,你 的 程序 需要 使 用 slecp(1) 等 待 ls ME BRR. HK 
需要 确保 你 的 程序 不 会 永远 处 于 等 待 状态 。 
(3) 写 一 个 不 用 lock_passwd 的 unlock passwd 函数 。 
C4) 本 例 显 水 了 允许 进程 给 一 个 已 存在 的 文件 上 锁 , 但 是 如 何 使 用 link 编程 避免 
两 个 进程 创建 同样 的 文件 呢 ? 
(5) 学习 命令 vipw。vipw Jg ifr Fla Hier? 




















Bü - EIER id os (CHE RE FE BREE ROT BA EEE f fox 
件 时 ,文件 的 锁 必 须 被 删除 。 如 果 程 序 不 释放 锁 ,其 他 的 程序 将 会 永远 处 于 等 符 
状态 ， 如 果 程 序 丰 漏洞 ,在 它 释 放 锁 之 前 崩 泪 ,或 被 用 户 按 下 Ctrl-C 结束 ,将 会 
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5. 26 


5. 27 


6. "EB 
基于 本 


write 


怎样 ? 

一 种 解决 方法 是 拥有 锁 的 程序 每 隔 x 秒 修改 文件 。 程 序 可 以 使 用 ime 去 做 。 
等 待 锁 的 程序 可 查看 修改 时 间 , 检 查 锁 是 否 依然 有 效 ， 如 果 锁 在 上 述 规定 的 问 
隔 中 未 被 修改 ,那么 其 他 的 程序 可 随意 删除 链接 ,然后 再 次 创建 链接 。 

编写 一 个 lock_passwd 的 新 版 本 ,使 之 带 有 表示 秒 数 的 数字 参数 。 这 个 新 版 本 能 
GESESE E Hp PEE Re SH. 


如 果 关 闭 缓 冲 , 将 会 有 什么 影响 ? 编写 一 个 程序 ,用 来 将 一 个 大 的 磁盘 文件 分 装 
在 小 的 片 里 面 ,例如 2MB 的 文件 被 分 装 在 16 字 节 的 片 的 集合 中 。 将 O_SYNC 
开启 和 关闭 进行 试验 。 改 变 文 件 和 分 片 的 大 小 ,以 查看 它们 如 何 影响 结果 。 


前 文 包含 了 关闭 文件 描述 符 磁 盘 缓 冲 的 代码 。 编 写 一 个 将 缓冲 重新 开启 的 程序 。 


编写 一 个 称 为 uppercase.< 的 程序 ,用 来 跟踪 终端 驱动 器 里 的 OLCUC 位 ,并 报告 
该 位 的 当前 状态 。 


stty ~a 的 输出 包含 终端 窗口 的 行 数 和 列 数 。 这 些 值 不 是 来 自 tegetattr 而 是 来 
自 ioctl。 使 用 这 个 系统 调用 修改 第 1 章 的 more, 使 它 能 够 使 用 终端 窗口 的 大 小 
显示 ,而 不 是 固定 值 24。 





章 的 内 容 , 能 够 了 解 和 编写 以 下 这 些 Unix PRI 
„stty passwd wall biff .mt 磁带 榨 制 程序 ,可 能 体 的 系统 上 没有 ) 
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概念 与 技巧 

。 软件 工具 与 用 户 程 序 

* 读 取 和 修改 终端 驱动 程序 的 设置 

+ 终端 驱动 程序 的 模式 

* 非 阻塞 输入 

* 用 户 输入 的 超时 

* 对 信和 号 的 介绍 : Ctrl+ 忆 是 如 何 工 作 的 
相关 的 系统 调用 


* fentl 





* signal 


6.1 软件 工具 与 针对 特定 设备 编写 的 程序 


在 Unix 系统 ,虽然 设备 看 起 来 很 像 蓄 盘 文 件 , 和 但 是 设备 是 不 同 于 磁盘 文件 的 。 在 第 5 
章 中 已 经 看 到 ,程序 能 对 设备 执行 open .close read, write 和 lseek 操作 ,但 是 也 已 经 看 到 设 
备 有 相应 的 驱动 程序 ,那些 驱动 程序 包含 许多 与 设备 相关 的 控制 和 属性 。 程 序 如 何 认识 这 
BOX ETE? 

L 软件 工具 : 从 stdin 或 文件 读 入 , 写 到 stdout 

对 磁盘 文件 和 设备 文件 不 如 以 区 分 的 程序 粒 称 为 软件 工具 。Unix 系统 有 好 几 百 个 软件 
工具 ,包括 who.s.sort,uniq.grep.tr 和 和 du。 软 件 工 具 使 用 图 6. 1 所 示 的 模型 。 

软件 工具 从 标准 输入 读 取 字 节 ,进行 一 些 处理 , 然 后 将 包含 结果 的 字 节 流 写 到 标准 输 
出 工具 发 送 错误 消息 到 标准 错误 输出 ,它们 也 被 当做 简单 的 字 节 菠 来 处 理 。 这 些 文件 描 
述 符 能 够 连接 到 文件 ,终端 ,和 鼠标、 光电 管 ,打印 机 和 管乐器 ; 工具 对 所 处 理 的 数据 的 源 和 目 
的 地 不 做 任何 很 设 。 其 他 很 多 程序 也 能 从 命令 行 所 指定 的 文件 中 读 取 数据 。 
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事实 : 大 多 数 进 程 
自动 将 前 3 个 文件 
描述 符 打开 : 它们 
不 需要 调用 open() 
来 建立 连接 





图 6.1 3 种 标准 文件 描述 符 


这 些 程序 的 输入 和 输出 能 够 被 重 定向 到 任何 类 型 的 连接 上 : 


$ sort 二 outputfile 
$ sort x — /dev/lp 
$ who | tr '[a- z]' '[A- Z]' 


2. 特定 设备 程序 : 为 特定 应 用 控制 设备 

其 它 程序 (如 控制 扫描 仪 .记录 压缩 盘 、 操 作 磁 带 驱动 程序 和 拍摄 数码 相片 的 程序 ) 也 能 
同 特定 设备 进行 交互 。 在 本 章 中 将 通过 了 解 最 常见 的 与 特定 设备 相关 的 程序 (通过 终端 与 
人 交互 的 程序 ) 来 探讨 在 写 这 些 程序 时 用 到 的 概念 和 技术 。 将 这 些 面 向 终端 的 程序 称 为 用 
户 程序 。 

3. 用 户 程序 : 一 种 常见 的 设备 相关 程序 

用 户 程 序 的 例子 有 vi.emacs, pine,more,lynx, hangman, robots 和 许多 加 利 福 尼 亚 大 学 
伯克利 分 校 编写 的 游戏 程序 了 。 这 些 程序 设置 终端 驱动 程序 的 击 键 和 输出 处 理 方式 。 驱 动 
程序 有 很 多 设置 ,但 是 用 户 程序 常用 到 的 有 : 

(1) 立即 响应 击 键 事件 

(2) 有 限 的 输入 集 

(3) 输入 的 超时 

(4) 屏蔽 Ctrl-C 

下 面 将 通过 编写 一 个 实现 所 有 这 些 特点 的 程序 来 学 习 这 些 主题 。 


6.2 ”终端 驱动 程序 的 模式 


首先 讨论 在 前 面 章 节 中 提 到 的 终端 驱动 程序 。 下 面 通过 一 个 简短 的 转换 程序 来 深入 理 
解 设备 驱动 程序 的 细节 2: 


”这 些 程序 的 源 代码 可 以 在 网 上 找到 ,寻找 bsdgames。 
C 可 以 用 命令 做 同样 的 事情 ,但 是 tr BY) GNU 版 本 有 输入 缓冲 ,这 样 用 它 来 做 教学 的 例子 就 不 是 很 好 了 。 
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/* rotate.c : mapa->b, b 一 >c，:. z —»a 
* purpose;useful for showing tty modes 
*/ 


# include <stdio. h> 
# include <ctype. h> 


int main() 
{ 
int c; 
while ( ( c=getchar() ) ! = EOF ){ 
if (c == 'z') 
c = tat; 


else if (islower(c)) 
ett: 


putchar(c); 


6.2.1 规范 模式 : 缓冲 和 编辑 
使 用 默认 设置 运行 这 个 程序 (一 - 是 退 格 键 ) : 


$ cc rotate.c - o rotate 
$ ./rotate 

abx< - cd . 

bcde 

efgCtrl- C 

$ 


图 6.2 显示 了 终端 内核 rotate 程序 和 数据 流 。 





图 6.2 输入 的 内 容 和 程序 所 得 到 的 内 容 
上 述 的 实验 揭示 了 标准 输入 处 理 的 如 下 特征 ， 
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(1) 程序 未 得 到 输入 的 “x”, 这 是 因为 退 格 键 删除 了 它 ; 

(2) 击 键 的 同时 字符 显示 在 屏幕 上 ,但 是 直到 按 了 回 车 键 ,程序 才 接 收 到 输入 ; 

(3) Ctrl-C 键 结束 输 入 并 终止 程序 。 

程序 rotate 不 做 这 些 操作 。 绥 冲 、 回 显 、 编 辑 和 控制 键 处 理 都 由 驱动 程序 完成 。 图 6. 3 
显示 了 驱动 程序 中 的 操作 层次 。 












输入 处 理 : rotate 程序 


输入 编辑 


TEN rU 转换 成 “Nm 
回 显 
控制 字符 处 理 


图 6.3 终端 驱动 器 中 的 处 理 层 


缓冲 和 编辑 包含 规范 处 理 (canonical processing) 。 当 这 些 特 征 被 启动 ,终端 连接 被 称 为 
处 于 规范 模式 。 


6.2.2 非 规范 处 理 
现在 ,尝试 这 个 试验 (输入 仍旧 是 abx— cd, 然后 ,输入 efg Ctrl-C); 


$ stty - icanon; . /rotate 
abbcxy^? cdde 
effggh 


$ stty icanon 


命令 stty -icanon 关闭 了 驱动 程序 中 的 规范 模式 处 理 。 上 例 并 没有 展示 非 规范 模式 的 
各 个 侧面 ,而 只 是 演示 了 输入 处 理 方 式 被 改变 了 。 

特别 地 , 非 规范 模式 没有 缓冲 。 输 入 字母 “<a”, 驱动 程序 跳 过 缓冲 层 ,将 字符 直接 送 到 程 
FF rotate, 然 后 程序 显示 字符 “b”。 用 户 输入 未 被 缓冲 可 能 是 一 件 麻烦 事 。 当 用 户 试 图 删除 
一 个 字符 ,驱动 程序 不 能 做 任何 事情 ; 字符 早 就 送 给 程序 了 ， 

最 后 一 个 试验 ,尝试 以 下 命令 ,然后 再 次 输入 “abx<- cd” Rl*cfg"Ctrl - C; 

$ stty - icanon - echo ; . /rotate 


bcy^? de 
fgh 


$ stty icanon echo (注意 : 你 看 不 到 这 个 。 为 什么 ?) 


在 这 个 例子 中 关闭 了 规范 模式 和 回 显 模式 。 驱 动 程序 不 再 显示 所 输入 的 字符 。 输 出 
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仅 来 自 程序 。 当 退出 这 个 程序 时 ,驱动 程序 仍旧 处 于 无 回 显 、 非 规范 模式 中 ,并 且 一 直 处 
于 那 种 状态 直到 程序 改变 了 设置 。shell 打印 一 个 显示 符 , 等 待 下 一 行 命令 。 有 些 shell 重 
置 驱动 程序 ,而 有 些 不 这 么 做 。 如 果 shell 并 不 重 置 驱动 程序 ,将 继续 处 于 无 回 显 、 非 规范 
的 模式 中 。 


6.2.3 终端 模式 小 结 


如 果 还 未 在 终端 尝试 这 些 例子 ,现在 就 做 。 这 些 例 子 演示 了 终端 驱动 程序 的 不 同 模式 。 
当 为 Unix 设计 用 户 程序 时 ,需要 决定 哪 种 终端 模式 适合 这 个 应 用 。 

l. 规范 模式 

规范 模式 ,也 被 称 为 cooked 模式 ,是 用 户 常见 的 模式 。 驱动 程序 输入 的 字符 保存 在 缓冲 
区 ,并 且 仅 在 接收 到 回 车 键 9 时 才 将 这 些 缓冲 的 字符 发 送 到 程序 。 缓冲 数据 使 驱动 程序 可 以 
实现 最 基本 的 编辑 功能 ,如 删除 字符 .单词 或 整 行 。 当 用 户 分 别 按 下 删除 键 .单词 删除 键 或 
是 终止 键 时 ,这 些 功 能 就 会 被 调用 。 被 指派 到 这 些 功 能 的 特定 键 在 驱动 程序 里 设置 ,可 通过 
命令 stty 或 系统 调用 tcsetattr 来 修改 。 

2. 非 规范 模式 

当 缓冲 和 编辑 功能 被 关闭 时 ,连接 被 称 为 处 于 非 规范 模式 。 终端 处 理 器 仍旧 进行 特定 
的 字符 处 理 , 例 如 ,处 理 Ctrl-C 及 换行 符 和 回 车 符 之 间 的 转换 。 但 是 ,用 于 删除 .单词 删除 
和 终止 的 编辑 键 没有 特殊 的 意义 ,因此 相应 的 输入 被 视 作 常规 的 数据 输入 。 

如 果 用 非 规范 模式 编写 程序 ,并 且 希 望 用 户 能 够 编辑 他 们 的 输入 ,需要 在 你 的 程序 中 实 
现 编辑 功能 。 

3. raw 模式 

每 个 处 理 步骤 都 被 一 个 独立 的 位 控制 。 例 如 ,ISIG 位 控制 Ctrl-C 键 是 否 用 于 终止 一 个 
程序 。 程 序 可 随意 关闭 所 有 这 些 处 理 步 骤 。 

当 所 有 处 理 都 被 关闭 后 ,驱动 程序 将 
输入 直接 传递 给 程序 。 在 这 种 情况 下 , 驱 
动 程序 被 称 为 处 于 raw 模式 。 在 终端 驱动 
程序 更 为 简单 的 老 版 本 系统 中 ,有 个 特定 
的 模式 被 称 为 raw 模式 。 命 令 stty 支持 
raw 模式 ,将 它 作为 命令 行 的 一 个 选项 。 联 
机 帮助 上 有 关 stty 的 部 分 解释 了 raw 模式 
的 含义 。 

终端 驱动 程序 是 内 核 中 一 些 复杂 的 程 
序 。 通 过 前 面 的 学 习 和 试验 可 以 更 为 清楚 
地 了 解 它们 的 各 个 组 成 部 分 和 功能 。 图 6. 4 图 6.4 终端 驱动 程序 的 主要 组 成 部 分 
显示 了 其 主要 部 分 。 








D 或 者 是 当前 定义 的 EOF 键 ,通常 为 Ctrl-D. 
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各 种 模式 都 有 各 自 特 定 的 用 途 。 为 了 帮助 理解 这 些 模 式 的 实际 应 用 价值 ,下 面 开发 了 


一 个 使 用 不 同 模式 的 用 户 程序 。 


6.3 编写 一 个 用 户 程序 : play again. c 


很 多 用 户 应 刑 程序 ,例如 ,自动 皮 款 机 和 计算 机 游戏 , 郁 会 向 用 户 提出 yes/no 的 问题 ， 


以 下 程序 脚本 是 一 个 银行 应 用 程 序 的 主 忽 环 : 


并 1 fbin/sh 
g 
f atm. sh ~ a wrapper for two programs 
# ae 
while true 
do 
do a transaction H Tun a program 
if play again 共 run our program 
then 
continue # ify" loop back 
fi 
break # if "n" break 
done 


就 像 其 他 典型 的 Unix 风格 的 程序 ,这 个 银行 脚本 程序 将 程序 的 各 个 组 件 组 合 起 来 。 第 一 


个 组 件 是 一 个 称 为 do_a_transaction 的 程序 ,完成 ATM 的 丁 作 。 第 二 个 组 件 play_again, 从 用 户 
那 刀 得 到 "是 ”或 * 香 ”的 回答 。 下 面 实现 第 二 个 组 件 程序 。 这 样 的 组 件 架构 允许 方便 地 更 换 不 
IH RAR AY play again. 





play again. c 的 逻辑 很 简单 ， 
* 对 用 户 显示 提示 问题 

+ 接受 输入 

* 如 果 是 “y” ,返回 

* 如 果 是 “n”, 返 回 1 
l. fi: play againO. c 





完成 上 述 功 能 


/* play again0.c 
* purpose; ask if user wants another transaction 
* method: ask a question, wait for yes/no answer 
* returns; 0 = yes, 1 —-no 
* better: eliminate need to press return 
af 
4 include  «stdio. ho 


p include < termicos. h> 


# define QUESTION "Do you want another transaction" 











第 6 章 为 用 户 编程 : 终端 控制 和 信号 * 159 + 





int get_response( char * }; 


int maint) 
{ 
int response; 
response = get response(QUESTION); /x get some answer */ 
return response; 
} 
int get response(char * question) 
fs 
* purpose; ask a question and wait for a y/n answer 
* method: use getchar and ignore non y/n answers 
* returns; 0 — yes, 1 no 
xf 
{ 
printf(" & s (y/n)?", question); 
while(1}{ 
switch( getchar() ){ 
case 'y': 
case 'Y': return 0; 
case 'n'; 
case 'Nt: 


case EOF; return i; 


) 


这 个 程序 显示 提示 问题 ,然后 循环 读 取 用 户 的 输入 ,直到 用 户 输 入 了 “y”、“n”、“Y” 或 
“N”’A PIE. play againO 有 两 个 问题 ,这 两 个 问题 都 由 运行 时 处 在 规范 模式 引起 。 首 先 ,用 
户 必 须 接 回 车 键 ,play_again0 才能 接受 到 数据 。 第 二 , 当 用 户 按 回 车 键 时 ,程序 接收 整 行 的 
数据 并 对 其 进行 处 理 。 因 此 ,play_again0 把 下 面 的 输 大 作为 一 个 和 否定 的 回答 ， 


$ play againD 
Do you want another transaction (y/n) ? sure thing! 


58 —-T icd Je XS PE DL. ALL CES TRE BE eB TO 130 S ABO SEE. 
2. 例子: play againl.c 即时 响应 





/* play againl.c 
* purpose: ask if user wants another transaction 
* method: set tty into char - by - char mode, read char, return result 
* returns; 0 27-yes, 1 =>=noe 
* better: do no echo inappropriate input 
" 


4 include  «stdio.ho 
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t include <Ctermios. hi> 
S define QUESTION "Do you want another transaction" 


main() 
1 


int response; 


tty mode(0); /* save tty mode */ 

Bet crmode(); /* set chr ~ by - chr mode «/ 
response = get response( QUESTION), /* get some answer x/ 

tty mode(1); /* restore tty mode «/ 


return response; 


上 
Fr 


int get response(char * question) 
fx 
* purpose; ask a question and wait for a y/n answer 
* method: use getchar and complain about non y/n answers 
* returns: 0-7» yes, 1 ==>no 
ef 


int input; 
printf("5 s (y/n)?", question); 
while(1) { 
switch( input = getchar() }{ 
case 'y': 
case '¥'+ return 0; 
case 'n'; 
Case 'N'. 
case EOF: return 1; 
default: 
printf(" ncannot understand $&c, ", input); 


printf("Please type y or no Xn"); 


4 
J 


set crmode() 
Fx 
* purpose; put file descriptor 0 (i.e. stdin} into chr - by - chr mode 
x method; use bits in termios 
x/ 
i 
struct termios ttystate; 
tegetattr( 0, &ttystate); /* read curr, setting «/ 
ttystate.c lfiag &= --ICANON; /x no buffering */ 
ttystate.c cc[VMIN] = 1; /* get 1 char at a time x/ 
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tesetattr( 0 , TCSANOW, &ttystate)- /* install settings */ 
1 
fx how == 0 => gave current mode, how == 1 =>> restore mode * 
tty mode(int how) 
i 
static struct termios original mode; 
if ( how == 0) 
tcgetattr(0, &original mode); 
else 
return tcsetattr(D, TCSANOW, &original mode); 
1 


play. againl 首先 将 终端 置 于 一 个 字符 接着 一 个 字符 的 模式 (eharacter -by ~ character 
mode) ,然后 调用 消 数 显示 一 个 提示 符 ,并 获得 一 个 响应 ,最 后 设置 终端 为 原始 的 模式 。 注 
意 ,最 后 并 未 将 终端 置 于 规范 模式 。 取 而 代 之 的 是 ,将 原先 的 设置 复制 到 一 个 称 为 original_ 
mode 的 结构 中 ,结束 时 恢复 这 些 设置 ， 

将 终端 置 于 字符 输 和 人 模式 包括 两 部 分 工作 。 除 了 将 CANON 位 关闭 外 ,还 要 将 值 1 分 
配给 控制 字符 数组 中 以 VMIN 为 下 标的 元 素 。VMIN 的 值 告诉 驱动 程序 一 次 可 以 读 取 多 少 
个 字符 。 因 为 着 望 一 个 搂 一 个 地 读 取 字 符 , 所 以 将 这 个 值 置 为 1。 如果 和 希望 一 次 读 取 3 个 字 
符 了 , 则 可 和 将 值 置 为 3。 

编译 并 运行 这 个 程序 ,输入 sure 作为 回答 ， 


5 make play againl 

cc play againl.c - o play againl 

$ . /play againl 

Do you want another transaction (y/n)? s 
cannot understand s, Please type y or no 
u 

cannot understand u, Please type y or no 
r 

cannot understand r, Please type y or nn 
e 


cannot understand e, Please type y or no 


Y$ 
像 预期 的 那样 ,Play_againl 接收 和 处 理 字符 ,而 不 再 等 待 回 车 键 , 亿 是 对 每 个 非 业 字符 


都 提示 错误 信息 可 能 让 人 觉得 比较 烦 。 一 个 更 好 的 设计 是 关闭 回 显 模式 ,丢掉 不 需要 的 字 
符 , 直 到 得 到 可 接受 的 字符 为 止 。 





DO 实际 二 我 用 这 个 处 理 功 能 键 。 在 很 多 键盘 上 ,功能 键 发 送 多 个 字符 序列 ,例如 escape 表示 -[ -1 _ 1， 当 键 盘 
iF escape 字符 (ASCII 27) , 它 期 待 -- 次 恋人 一 行 上 的 3 个 或 4 个 字符 。 
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3 例子 ;play_again2. c- —— 4 wi 3E 3k ot 


/* play again2.c 
* purpose: ask if user wants another transaction 
x method. set tty into char — by — char mode and no — echo mode 
x read char, return result 
* returns: 0 => yes, l 二 人 TO 
* better: timeout if user walks away 
* 
f 
zx include <Ustdio. k> 


# include  -—termios. hr 
#define QUESTION "Do you want another transaction" 


maint } 
{ 
int response; 
tty_mode(0); /* save mode #/ 
set cr noecho mode(); /* set 一 icanon, - echo «/ 
response = get response(QUESTION); /* get some answer »/ 
tty mode(1); /* restore tty state «/ 
return response; 
} 
int get response(char x question) 
fs 
* purpose; ask a question and wait for a y/n answer 
* method; use getchar and ignore non y/n answers 
* returns; 0 => yes, 1 —no 
af 
{ 


printf("& s (y/n)?", question); 


while(1)i 
switch( getchar() ?1 
case 'y'; 


case !Y'; return 0; 
case int: 
case 'N'. 


case EOF; return 1; 


1 


set cr noecho moda() 
fm 
* purpose; put file descriptor 0 into chr ~ by- chr mode and noecho mode 
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x method; use bits in termios 
xf 
i 


struct termios ttystate; 


tcgetattr( 0, &ttystate); /* read curr, setting x/ 
ttystate.c lflag  &- ~ICANON; /* no buffering */ 
ttystate.c lflag  &- --ECHO; /* no echo either «/ 
ttystate.c ec[ VMINI| =]; /* get 1 char at a time */ 
tesetattr( 0 , TCSANOW, &ttystate); /* install settings x/ 

} 

/* how == 0 => save current mode, how == 1 => restore mode >， 


tty mode(int how) 
{ 
static struct termios original_mode; 
if ( how == 0) 
tcgetattr(0, &original mode); 
else 
return tesetattr(0, TCSANOW, &original mode); 
} 


这 个 程序 和 前 面 的 版 本 在 两 个 方面 有 所 不 同 。 设 置 终 端 驱动 程序 的 函数 关闭 了 回 显 
位 。 注 意 ,恢复 函数 不 需要 特意 将 该 位 开启。 另 一 个 变化 是 函数 get_response 不 再 提示 错误 
信息 ,而 仅仅 是 忽略 它们 。 

编译 并 运行 这 个 程序 。 如 果 输 入 sure, 没 有 显示 任何 内 容 。 仅 当 输 人 y 或 ma 时 ,程序 
返回 。 

play again2 如 所 希望 的 那样 运行 ,但 是 它 还 有 待 改 进 。 如 果 这 个 程序 运行 在 真正 的 
ATM 上 ,而 顾客 在 输入 y Rn 之 前 走 开 了 ,将 会 怎样 ? 下 一 个 顾客 跑 过 来 按 下 y, 就 能 进入 
那个 离开 的 顾客 的 账号 。 所 以 如 果 用 户 程序 包含 超时 特征 ,会 变 得 更 安全 。 


非 阻 塞 输入 : play again3. c 


下 一 个 程序 版 本 合 有 超时 特征 。 通 过 设置 终端 驱动 程序 ,使 之 不 等 待 输 作 来 实现 这 个 
特征 。 先 检查 看 是 否 有 输入, 如 果 恬 现 没 有 输入 , 则 先 睡眠 几 秒 钟 ,然后 继续 检查 输入 ， 如 
此 尝试 3 次 之 后 放弃 。 

1 阻塞 与 非 阻塞 输入 

当 调 用 getchar 或 read 从 文件 描述 符 读 取 输 人 时 ,这 些 调用 通常 会 等 待 输入 。 在 play_ 
again 例子 中 ,对 getchar 的 调用 使 得 程序 一 直 等 待 用 户 的 输入 ,直到 用 户 输 人 一 个 字符 。 程 
序 被 阻塞 ,直到 能 获得 某 些 字符 或 是 检测 到 了 文件 的 末尾。 那么 如 何 关闭 输 人 阻塞 呢 ? 

阻塞 不 仅仅 是 终端 连接 的 属性 ,而 是 任何 一 个 打开 的 文件 的 属性 。 程 序 可 以 使 用 feni 
或 open 为 文件 描述 符 启 动 非 阻塞 输 人 (nonbloek input), play. again3 使 用 fent! 5 oc f Hs 
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述 符 开启 O NDELAY? 标志 。 

鞠 闭 一 个 文件 描述 符 的 阻塞 状态 并 调用 read, FEUER? 如 果 能 够 获得 输入 ,read 
获得 输 人 并 返 向 所 获得 的 字符 个 数 。 如 果 汪 有 输入 字符 ,read 返回 0. ORL [808 3] PPAR EE 
. 一样。 如 具有 错误 ,read 返回 一 1。 

非 阻塞 操作 的 内 部 实现 相当 简单 。 每 个 文件 都 有 一 块 保存 未 读 取 数据 的 地 方 ,如 图 6.4 
所 示 的 驱动 程序 里 最 顶端 的 存储 方 殷 。 如 果 文 件 描述 符 置 了 O 〇 _NDELAY 位 ,并 且 那 块 空间 
是 空 的 ,read 调用 返回 0。 如 果 能 阅读 与 O_NDEILAY 有 关 的 的 Linux 源 人 代码, 就 可 以 了 解 
到 实现 的 细节 。 

2. 例子 :play_again3. c 





使 用 非 阻塞 模式 实现 超时 响应 


/* play again3.c 
* purpose; ask if user wants another transaction 
* method; set tty inte chr- by- chr, no- echo mode 
* set tty into no - delay mode 
* read char, return result 
* returns; 0 => yes, | -—no, 2 => timeout 
* better; reset terminal mode on Interrupt 
af 
i include <Cstdio. h> 
# include <termios. hi> 
# include «fenti. ho 
# include «string. ho 


#idefine ASK “Doe you want another transaction" 


Hdefine TRIES 3 /* max tries x/ 
Hdefine SLEEPTIME 2 /* time per try «/ 
dS define BEEP putchar(*\a'} /* alert user «/ 
maint} 


i 


int response; 


tty node(0); /* save current mode x/ 
set cr noecho mode(); /* set — icanon, — echo «/ 
set nodelay mode(); /* noinput =>> EOF «/ 


response = get response(ASK, TRIES); /x get some answer x, 
tty mode(1); /* restore orig mode * f 
return response; 

} 

get response( char * question , int maxtries} 

A 


* purpose; ask a question and wait for a y/n answer or maxtries 





© tai AO NONBLOCK fir, ize SJ LAE BO. 
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* method: use getchar and complain about non- y/n input 
* returns; 0="yes, 1 -7no, 2=>timeout 
x 


i 


int input; 
printf("& s (y/n)?", question); /* ask */ 
fflush(stdout); /* force output */ 
while ( 1 )( 
sleep{ SLEEPTIME) ; /* wait a bit x/ 
input = tolower(get ok char()); /* get next chr « / 
if ( input == 'y') 
return D, 
if ( input == in!) 
return 1; 
if (maxtries-- == 0) /* outatime? x/ 
return 2; /* sayso a; 
BEEP; 


F 


} 
* skip over non- legal chars and return y,¥,n, or EOF 
xf 
get ok char() 
i 
int c; 
while( ( c = getchar() ) t= EOF && strchr("yYnN",c) == NULL ) 
return c; 
} 
set cr noecho mode() 
fe 
* purpose: put file descriptor 0 into chr - by— chr mode and noecho mode 
x method: use bits in termios 
xf 
$ 


struct termios ttystate; 


tcgetattr( 0, &ttystate); /* read curr. setting x/ 
ttystate,c lflag &= ~ICANON; /* no buffering «/ 
ttystate.c lflag &= ~ECHO; /* no echo either «/ 
ttystate.c cc[VMIN) = 1; /* get 1 char at a time «/ 
tesetattr( 0 , TCSANOW, &ttystate); /* install settings «/ 


} 
set nodelay mode() 
/* 
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* purpose: put file descriptor 0 into no- delay mode 
x method: use fentl to set bits 
* notes: tesetattr() will do something similar, but it is complicated 


xf 


int termflags; 


termflags = fcntl(O, F_GETFL); /* read curr. settings «/ 
termflags | = © NDELAY; /* flip on nodelay bit x/ 
fcntl(O, F SETFL, termflags); /* and install rem */ 

} 

fs how == 0 27 save current made, how == 1 => restore mode */ 


/* this version handles termios and fcntl flags x/ 
tty mode(int how) 
{ 
static struct termios original mode, 
static int original flags; 
if ( how == 0 ){ 
tegetattr(0, &original mode); 
original flags = fcntl(0, F_GETFL); 
} 
else | 
tcsetattr(0, TCSANOW, &original mode); 
fentl( O0, F SETFL, original flags); 
} 
} 


程序 的 这 个 版 本 有 一 些 新 特点 。 首 先 司 用 fcntl 关闭 和 开启 非 阻 塞 模式 ,其 次 在 get. 
response 中 使 用 sleep 和 计数 器 maxtries 。 

3. play again3 的 小 问题 

play again3 并 不 是 理想 的 。 运行 在 非 了 胆寒 模式 ,程序 在 调用 getchar 给 用 户 输 人 字符 之 
前 睡眠 2s。 就 算 用 户 在 ls 内 完成 输入 ,程序 也 要 在 2s 后 才 得 到 字符 。 用 广 可 能 会 感到 迷 
惑 :“ 我 不 是 答 人 了 吗 ? 怎么 没 反映 呢 ? 难道 说 我 弄 错 了 ?” 

可 以 使 程序 更 快 地 做 出 响应 吗 ? 可 以 减少 每 次 调用 getchar 间 的 睡 眼 时 间 , 并 相应 地 增 
加 循环 次 数 来 实现 相同 的 超时 设置 。 

另外 ,注意 在 显示 提示 符 之 后 对 flush 的 调用 。 如 果 没 有 那 一 行 ,在 调用 getchar 之 前 ， 
提示 符 将 不 能 显示 。 究 其 原因 是 ,终端 驱动 程序 不 仅 … 行 行 地 缓冲 输入 ,而 且 还 一 行 行 地 组 
"hii HH 驱动 程序 缓冲 输出 ,直到 它 收 到 一 个 换行 符 或 者 程序 试图 从 终端 读 取 输入 。 在 这 
个 例子 中 ,为 了 给 用 户 读 提 示 符 的 时 间 ,需要 延迟 读 入 。 这 样 就 必须 调用 lush. 

4. 实现 超时 的 其 他 方法 

Unix 提供 更 好 的 方法 来 实现 超时 功能 ,在 驱动 程序 中 设置 数组 ce_cc[] 中 的 元 素 VTIME 
将 超时 功能 的 实现 移 至 终端 驱动 程序 。 本 章 的 一 个 练习 提供 了 相关 细节 。 系 统 调 用 select 
包含 一 个 超时 参数 。 将 在 后 面 的 章节 中 讨论 select, 
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5. play again3 的 一 个 大 问题 
play again3 般 略 它 所 不 想 要 的 字母 ,识别 和 处 理 合法 输入 ,并 在 规定 的 时 间 问 隔 内 无 合 
法 输入 的 情 襄 下 自动 退出 。 但 是 如 此 用 户 输入 Ctrl-C 将 会 如 何 ? 下 面 蚌 它 的 运行 情况 : 





5 make play again3 
cc play again3.c - o play again3 


$ . /piay againi 

Do you want another transaction (y/n}? press Ctrl - C now 
$ logout 

Connection to host closed. 

bashs 


当 按 下 Ct C 终止 程序 play_again, 不 但 终止 了 这 个 程序 ,同时 也 终止 了 整个 登录 会 
话 。 这 是 为 什么 呢 ? play again3 A3 SER: 切 始 化 ,获得 用 户 输入 和 恢复 设置 ,如 在 图 6.5 
中 描述 的 那样 。 
设置 O_ NDELAY 
LE 设置 crmode 
显示 提示 符 。 。” 当 读 取 终止 时 的 流向 


| 等 等 用 户 输入 
一 一 一 一 一 一 一 pe 进程 被 终止 














SIGINT M» 
恢复 ty 设置 


进程 正常 退出 时 的 流向 -| POE fond 标志 
y 2S 





进程 正常 退出 
图 6.5 Ctl- CH LHRH E SE 38 BUT ORE POR US 


BARAA mE TIERRA RS. A Bl EA E JR SE TT ED SEO S BE RR iE 


取 输 入 。 然 后 在 程序 运行 中 通过 按 Ctrl ~-C 键 来 终止 程序 。 那 么 终端 驱动 程序 处 于 什么 
状态 ? 


实际 上 程序 会 立刻 退出 ,而 林 执 行 重 置 晓 动 程序 的 代码 。 当 返回 shell 最 示 提 示 符 并 从 
用 户 处 获得 命令 行 时 ,终端 仍 昌 处 于 非 阻 塞 横 式 。shell 调用 read 获取 命令 行 ,但 是 因为 处 
于 非 阻 塞 状态 ,read 立即 返回 0。 总 之 ,程序 结束 时 文件 措 述 符 处 于 一 个 错误 的 状态 。 下 一 
个 目标 是 学 习 如 何 避 人 免 程 序 被 Ctrl1-C B AEN IAE, 

6. 为 什么 有 此 情况 下 不 会 被 注销 ? 

很 多 Unix shell 包含 编辑 特征 ,如 使 用 箭头 键 在 执行 过 的 命令 列表 中 滚动 。 这 些 shell 
运行 在 实现 这 些 功能 所 需要 的 raw 模式 下 。 当 程序 退出 或 死亡 时 , 像 bash 和 tesh 这 些 shell 
立即 重 置 终 端的 属性 。 . 
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6.4 [fi 号 


Ctrl-C 中 断 当前 运行 的 程序 。 这 个 中 断 由 一 个 称 为 信号 的 内 核 机 制 产生 。 信 号 是 一 个 
简单 而 重要 的 概念 。 下 面 将 探讨 信号 的 基本 概念 ,学 习 怎 样 使 用 它们 解决 play_again3 的 问 
题 。 在 下 一 章 中 将 更 深入 地 学 习 信 号 。 


6.4.1 Ctrl 一 C 做 什么 


输入 Ctrl-C, 程 序 便 被 终止 了 。 一 个 单一 的 击 键 是 如 何 杀 死 一 个 进程 的 呢 ? 和 终端 驱动 
程序 在 这 里 起 了 相应 的 作用 , 图 6.6 显示 了 相应 的 事件 链 。 


用 户 输入 Ctrl-C 

. 了 驱动 程序 收 到 字符 

匹配 VINTR 和 ISIG 的 字符 被 开启 
驱动 程序 调用 信号 系统 

信号 系统 发 送 SIGINT 到 进程 

. 进程 收 到 SIGINT 

进程 消亡 





mag M o N 





6.6 Ctrl-C 如 何 工作 


中 断 信号 的 击 键 组 合 不 一 定 非 是 Ctrl -C, 可 以 使 用 stty( 或 者 tcsetattr) 将 当前 的 
VINTR 控制 字符 替换 成 另 一 种 键 。 


6.4.2 信号 是 什么 


按 下 Ctrl-C 产生 一 个 信号 ,那么 信号 是 什么 呢 ? 信号 是 由 单个 词组 成 的 消息 。 绿 灯 是 
一 个 信号 ,停止 标牌 是 一 个 信号 ,裁判 手势 也 是 一 个 信号 。 这 些 物体 和 事件 不 是 消息 , 走 、 停 
和 出 界 才 是 消息 。 当 按 Ctrl-C 时 ,内 核 向 当前 正在 运行 的 进程 发 送 中 断 信 号 。 每 个 信号 都 
有 一 个 数字 编码 。 中 断 信号 通常 是 编码 2。9 

信号 从 哪里 来 ?信号 来 自 内 核 , 生 成 信号 的 请 求 来 自 3 个 地 方 ,如 图 6.7 所 示 。 

(1) 用 户 

用 户 能 够 通过 输入 Ctrl-C、Ctrl-\ ,或 是 终端 驱动 程序 分 配给 信和 号 控制 字符 的 其 他 任何 
键 来 请 求 内 核 产 生 信 号 。 

(2) 内 核 

当 进 程 执行 出 错时 ,内 核 给 进程 发 送 一 个 信号 ,例如 ,非法 段 存 取 、 浮 点 数 溢出 ,或 是 一 


Q EBEE IFE shell 脚本 将 出 问题 。 








(3) 进程 
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图 6.7 信和 号 的 3 种 来 源 


个 非法 的 机 器 指令 。 内 核 也 利用 信和 号 通知 进程 特定 事件 的 发 生 。 


一 个 进程 可 以 通过 系统 调用 kill 给 另 一 个 进程 发 送信 号 。 一 个 进程 可 以 和 男 一 个 进程 


通过 信号 通信 。 


由 进程 的 某 个 操作 产生 的 信号 被 称 为 同步 信号 (synchronous signals) ,例如 ,被 零 除 。 


由 像 用 户 击 键 这 样 的 进程 外 的 事件 引起 的 信号 被 称 为 异步 信号 (asynchronous signals) 。 


哪里 可 以 找到 信和 号 的 列表 ? 信号 编号 以 及 它们 的 名 字 通 常 出 现在 /usr/iiiclude/signal. h 


文件 中 。 这 里 是 这 个 文件 的 一 部 分 : 


#define SIGHUP 1 /* hangup, generated when terminal disconnects x/ 

# define SIGINT 2 /* interrupt, generated from terminal special char x/ 
# define SIGQUIT 3 /* (* ) quit, generated from terminal special char #/ 
# define SIGILL 4 /* ( * ) illegal instruction (not reset when caught) #/ 
# define SIGTRAP 5 /* ( * ) trace trap (not reset when caught) */ 

# define SIGABRT 6 /* ( * ) abort process «/ 

# define SIGEMT 7 /* ( * ) EMT instruction */ 

#define SIGFPE 8 /* ( * ) floating point exception */ 

f define SIGKILL 9 /* kill (cannot be caught or ignored) «/ 

#define SIGBUS 10  /« (*) bus error (specification exception) «/ 

# define SIGSEGV 11  /« (x) segmentation violation x/ 

# define SIGSYS 12 /x(*) bad argument to system call #/ 

# define SIGPIPE 13 /* write ona pipe with no one to read it «/ 

# define SIGALRM 14 /x alarm clock timeout x/ 

#define SIGTERM 15  /x software termination signal «/ 


例如 ,中 断 信 号 被 称 为 SIGINT, 退 出 信号 被 称 为 SIGQUIT, ,非法 段 存 取信 号 是 


SIGSEGV。 任 何 一 个 版 本 的 Unix 的 手册 都 包含 更 多 的 相关 信息 。 在 Linux 中 ,可 以 查看 
signal(7) 的 相关 联机 帮助 。 

信号 做 什么 ? 这 要 视 情 况 而 定 。 很 多 信号 杀 死 进程 。 某 时 刻 进程 还 在 运行 ,下 一 秒 它 
就 消亡 了 ,从 内 存 中 被 删除 ,相应 的 所 有 的 文件 描述 符 被 关闭 ,并且 从 进程 表 中 被 删除 ， 使 
用 SIGINT 消灭 一 个 进程 ,但 是 进程 也 有 办 法 保护 自己 不 被 杀 死 。 
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6.4.3 进程 该 恕 何 处 理 信 号 


当 进 程 接收 到 SIGINT 时 ,并 不 -一定 非 要 消亡 。 进 程 能 够 通过 系统 调用 signal 告诉 内 
核 , 它 要 如 何 处 理 全 号。 进程 有 3 个 选择 。 

C1) Bese aR Sb Be GE E AEBS) 

FUMES T XR M RIA SERES. SIGINT 的 软 认 处 理 必 消亡。 进程 并 不 一 定 要 
使 用 signal 接受 默 汰 处理, 但 是 进程 能 够 通过 以 下 调用 来 恢复 上 默认 处 理 : 








signal (SIGINT, SIG DFL); 


(2) NS T 
程序 可 以 通过 以 下 调 几 来 告诉 内 核 , 它 需要 忽略 SIGINT fiit. 


signal (SIGINT, S1G IGN); 


(3) 调用 一 个 函数 

第 3 种 选择 是 3 个 当中 最 强大 的 一 种 。 考 虚 play_again3 这 个 例子 。 当 用 户 输入 Ctrl- 
C. 当前 送行 的 程序 立即 退出 ,而 不 调用 恢复 驱动 程序 设置 的 郑 数 。 更 好 的 合法 是 ,程序 在 接 
收 到 SIGINT 后 ,调用 一 个 恢复 设置 的 机 数 ,然后 再 退出 。 

调用 signal 的 第 3 种 选择 允许 这 种 类 型 的 响应 。 程 序 能 够 告诉 内 核 . 当 信 生 到 来 时 应 该 
调用 哪个 函数 。 在 信号 到 来 时 被 调用 的 函数 被 称 为 信和 号 处 理 泗 数 。 为 安装 信号 处 理 函 数 ， 
程序 调用 ， 


signal (signum, functionname); 




















signal 
目标 简单 的 信号 处 理 
3x4 # include «signal, hz 
函数 原型 result = signal (int signum, void ( * action) int); 
signum 需 响 应 的 信和 号 
参数 action 如 柯 响 应 
i] E j Htoo 
x ER 通 到 错误 


prevaction 成 功 返 还 





调用 signal 为 编码 是 signum 的 信号 安装 新 的 信号 处 理 函 数 。action 可 以 是 函数 名 或 以 
下 两 个 特殊 值 之 一 。 

，STIG_IGN， 忽 略 信和 号， 

* SIG. DEL, 将 信 导 恢复 为 默认 处 理 。 

signal jR PRT ' 个 处 理 函 数 。 值 是 指向 丽 数 的 指针 。 
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6.4.4 信号 处 理 的 例子 
l. 捕捉 信号 


/* sigdemol.c 一 shows how a signal handler works. 
* — run this and press Ctrl -C a few times 

x/ 

# include <stdio.h> 

# include <signal. h> 


main() 
{ 
void f(int); /* declare the handler */ 
int i; 
signal( SIGINT, f ); /* install the handler */ 
for (i=0; i<5;i++){ /* do something else «/ 
printf("hello Wn"); 
sleep(1); 
) 
) 
void f(int signum) /* this function is called «/ 


{ 
printf("OUCH! \n") ; 
} 


主 函 数 由 两 部 分 组 成 ,调用 signal 后 进入 一 个 循环 。sigdemol. c 调用 signal 来 设置 
SIGINT 的 处 理 函 数 f。 如 果 进 程 接 收 到 SIGINT 信号 ,内 核 会 调用 函数 f 来 处 理 这 个 信和 号。 
程序 跳 转 到 那个 函数 ,执行 它 的 代码 ,然后 返回 到 跳 转 前 的 位 置 ,就 像 子 过 程 调用 一 样 。 

6.8 显示 了 两 个 独立 的 控制 流 : 一 个 是 正常 的 路 径 , 进 入 main, 执行 循环 ,然后 从 
main 返回 ; 另 一 个 是 由 信号 引起 的 路 径 , 进 入 ,然后 返回 。 


SIGINT 的 到 达 将 控制 流转 向 信号 
处 理 器 。 从 信号 处 理 器 返回 后 继续 
一 一 正常 控制 流 执行 原来 的 控制 流 。 





信号 处 理 流程 


图 6.8“ 信 和 号 引起 了 于 过程 的 调用 
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以 下 是 程序 运行 情况 ; 

$ . /sigdemol 

hello 

hello press Ctrl - C now 

OUCH! 

hello press Ctrl 一 C now 

OUCH! 

hello 

hello 

$ 

试 编译 并 运行 这 个 程序 。 程 序 中 没有 对 工 的 显 式 调用 。 接 受到 的 信号 引发 了 对 那个 函 
数 的 调用 。 

2， 忽 略 信号 

/* sigdemo2.c - shows how to ignore a signal 

x - press Ctrl- X to kill this one 

x/ 


# include -—stdio.h-— 


# include <signal. h> 


main() 
1 
signal( SIGINT, SIG IGN ); 
printf("you can't stop me! Mn"); 
while( 1 ) 
{ 
sleep(1); 
printf("haha\n") ; 


} 


sigdemo2. c 调用 signal 来 设置 为 忽略 中 断 信 号 。 可 以 随意 的 按 Ctrl-C 而 不 会 对 进程 
产生 影响 。 
signal(SIGINT，SIG_IGN) 的 效果 如 图 6. 9 所 示 。 


进程 告诉 内 核 需要 忽 赂 SIGINT pp 
sigdemo2 ó 


图 6.9 signal (SIGINT, SIG_IGN) 的 效果 
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以 下 是 程序 的 运行 情况 : 


S ./sigdeno2 

you can't stop mel 

haha 

haha 

haha press Ctri - C now 
haha press Ctrl - C nowpress Ctrl - C now 
haha 

haha 

haha press *\now 

Quit 

$ 


按键 组 合 Ctrl-\e Rik - TAA fi SBD quit fà mox BUT A ZR ae du 
SIGQUIT. 


6.5 为 处 理 信号 做 准备 : play againd.c 


现在 已 经 知道 如 何 修改 Play_again3.e 来 处 理 信号 ,但 是 还 需要 做 一 个 恋 计 决策 。 需 要 
忽略 信号 并 让 用 户 回答 yes 或 no 吗 ? 要 捕捉 键盘 信号 网? 当 用 户 输入 no 时 ,要 直接 退出 还 
是 先 返 回 一 个 值 表示 程序 已 经 消亡 ? 

下 面 这 个 程序 版 本 搬 捉 SIGINT, 重 置 驱动 程序 ,然后 返回 no 的 代码 ， 








/* play againd.c 
* purpose; ask if user wants another transaction 


* method; set tty into chr - by- chr, no- echo mode 


* set tty into no- delay mode 
* read char, return result 
* resets terminal modes on SIGINT, ignores SIGQUIT 


* returns; 0 => yes, L=>>no, 2=>timeout 


* better; reset terminal mode on Interrupt 


* / 
# include < stdio, h> 
# include termios. hi 
+ include xCfentl. h> 
# include «string, h> 
it include < signal. h> 
#define ASK "Do you want another transaction" 
define TRIES 3 /* max tries «/ 
#define  SLERPTIME 2 /* time per try «/ 


H define BEEP putchar( "\ar} /* alert user »/ 
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maini) 
1 
int response; 


void ctrl c handler(int); 


tty mode(0); 

set cr noecho modet); 

set nodelay modei?; 

signal( SIGINT, ctr! c handler }; 
signal( SIGQUIT, SIG IGN 5; 

response = get response(ASEK, TRIES); 
tty modecl); 

return response; 


à 
i 


get response( char » question , int maxtries) 


; 
Fikia 


/* save current mode &/ 

/* set 一 icanon, ~ echo #/ 
/* noinput -2» EOF +; 

¿x handle INT x/ 

/* ignore QUIT signals */ 
/* get some answer x/ 


/* reset orig mode «/ 


* purpose; ask a question and wait for a y/n answer or timeout 


* method: use getchar and complain about non - y/n input 


* returns; 0 => yes, 1 =>no 


*/ 


1 


int input; 


printf("* s (y/n)?", question; 
fflush(stdout); 
while ( 124 
sleep(SLEEPTIME) ; 
input = tolowerí(get ok char()); 
if ( input == tyr) 
return 0; 
if ( input == 'n') 
return l: 
if ( maxtries-- == 0) 
return 2; 


BEEP; 


: 


f * 


/* ask «/ 


/* Force output «/ 


/* wait a bit «/ 


/* get next chr x/ 


/* outatime? x; 


/* gayso x/ 


* skip over non- legal chars and return y,¥,n,N or EOF 


af 
get ok chart) 


i 
int c; 


while( ( c = getchar() ) 1= EOF && strebr("yYnN" c) == NULL) 


H 
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return e; 
} 
sek cr noecho model} 


fe 


* purpose; put file descriptor 0 into chr - by - chr mode and noecho mode 


* method: use bits in termios 


*/ 


{ 


struct termios ttystate; 


tcgetattr( 0, &ttystate); 


ttystate.c lflag &= --ICANON; 
ttystate.c lflag &- ~-ECHO; 
ttystate.c cc[VMIN] = 1; 


tcsetattr( 0 , TCSANOW, &ttystate) ; 


/* read curr, setting x/ 
/* no buffering x/ 

/* no echo either */ 

/* get i char at a time «/ 


/* install settings */ 





t 
set pnodelay modet) 
/* 
* purpose: put file descriptor 0 into no- delay mode 
Y method; use Fentl to set bits 
* notes; tcsetattr() will do something similar, but it is complicated 
LII 
{ 
int termflags; 
termflags = fcntl(0, F_GETFL}; 
termflags | = O_NDELAY; 


/* read curr. settings x/ 


‘x flip on nodelay bit «/ 


fentl(0, F SETFL, termflaqs); /* and install ‘em af 
} 
/* how == 0 => save current mode, how == 1 < restore mode x/ 
/* this version handles termios and fentl flags af 


tty mode(int how) 

{ 
static struct termios original mode; 
static int original_flags; 


stored = Q; 


, 


static int 


if ( how == 03] 
tcgetattr(0, &original mode), 
original flags = fenti(0, F GETFL); 
stored - 1, 

} 

else if ( stored ) | 
tcsetattr(0, TCSANOW, &eriginal mode); 
fentl( 0, F SETFL, original flags); 
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L 
了 


void ctrl c handler(int signum? 

ix 

* purpose; called if SIGINT is detected 
* action; reset tty and scram 

x? 


H 
1 


tty modet1); 
exit(1); 


其 他 的 设计 留 作 练习 。 
6.6 进程 终于 


程序 使 用 signal 来 千 诉 内 核 它 需要 忽略 电 些 信号 。 如 果 有 人 编写 了 一 个 将 所 石 类 型 的 
信号 设置 为 S1G_1GN 的 程序 ,然后 执行 一 个 无 限 循环 将 会 如 何 嘱 ? 

幸 杂 ,对 系统 管理 员 (C 和 程序 员 ) 来 说 ,Unix 不 可 能 让 -一 个 程序 永 不 停止 。 有 两 个 信号 是 
椒 能 被 忽略 和 捕 扣 的。 陪读 手册 或 头 文 件 中 的 信号 列表 ,看 看 哪些 信和 号 是 不 可 阻挡 的 。 


6.7 为 设备 编程 


现在 已 经 了 解 了 编 气 终 端 控 制程 厅 的 三 个 方面 。 首 先 ,学 习 了 张 动 程序 的 属性 和 如 何 
控制 连接 。 人 然后, 学习 了 应 用 程序 的 特定 需求 ,并 调整 驱动 程序 以 满足 这 些 需求 。 最 后 ,学 
习 了 如 何 处 理 信号 … 中 断 的 一 种 形式 。 

这 二 个 方面 对 所 有 有 的 设备 都 适用 。 考 虑 一 块 声卡 或 个 磁盘 驱动 程序 。 设 备 有 许多 种 
出 设备 驱动 程序 控制 的 设置 , 需要 了 解 这些 设 置 。 同样, 程序 必须 实现 特定 的 功能 ,调整 驱 
SR CRA eek. i RE RARER Se ORE RR eR. A 
驱动 程序 可 能 在 它 结束 从 磁盘 到 内 存 数 据 块 的 复制 时 发 送 一 个 信号 , 程序 必须 能 够 对 这 些 
信号 做 出 响应 。 




















小 结 


1， 主 要 内 容 

* 有 些 程序 处 理 从 特定 设备 来 的 数据 。 这 些 与 特定 设备 相关 的 程序 必须 控制 与 设备 的 
连接 。Unix 系统 中 最 常见 的 设备 是 终端 。 

， 终端 驱动 程 庆 有 很 多 设置 。 各 个 设置 的 特定 值 决定 了 终端 张 动 程序 的 模式 。 为 用 路 
编写 的 程序 通常 需要 设置 终端 驰 动 程序 为 特定 的 模式 。 

* 键盘 输 和 人 分 为 3 类 ,终端 驱动 程序 对 这 些 输 人 做 不 同 的 处 理 。 夫 多数 键 代 帮 常规 数 











第 6 章 为 用 户 编程 : eae fe «177+ 








dg ELLA Se oh Bee a) B.A a. RP DN 
Ba SE SK HR ORE Bn — Te PE A h h H BR 3E cs E E ee Fn 
从 显示 器 中 删除 字符 。 dme AA eE AR. Ctrl-C 键 告 诉 驱动 程序 调 
用 内 核 中 某 个 函数 ,这 个 函数 给 进程 发 送 一 个 信和 号。 终端 驱动 程序 支持 若 于 种 处 理 
控制 函数 ,它们 都 通过 发 送信 和 号 到 进程 来 实现 控制 ， 
* 信号 是 从 内 核发 送 给 进程 的 一 种 简短 消息 。 信 号 可 能 来 牟 用 户 .其 他 进程 或 肉 核 本 
身 。 进 程 可 以 告诉 内 核 ,在 它 收 到 信和 号 时 需要 做 出 怎样 的 响应 。 
2. 进一步 的 问题 
Unix 系统 总 是 从 很 多 终端 或 其 他 设备 接收 数据 。 用 户 可 能 在 任何 时 刻 输入 数据 ,内 核 
必须 处 理 这 些 输入 。Unix 系统 同时 运行 若干 个 程序 。 内 核 如 何在 同一 时 刻 维护 多 个 并 发 的 
任务 并 对 多 个 不 可 预知 的 中 断 作 出 响应 呢 ? 下 一 章 将 通过 编写 一 个 计算 机 游戏 程序 米 探讨 
这 个 问题 。 
3. 习题 
6.1 很 多 Unix 软件 工具 从 命令 行 指 定 的 文件 中 读 卢 数据。 命令 tr 不 是 这 样 。tr 是 用 
来 干什么 的 ? 能 想 出 它 不 接受 命令 行 指定 文件 名 的 原因 吗 ? 还 有 其 他 仪 从 标准 
输入 读 取 数据 而 不 从 指定 的 文件 中 读 取 数据 的 Unix THG? 大 少数 的 Unix fs 
S fF TE/bin, /usr/bin Al/usr/local/bin AEP, 


6.2 任何 文件 描述 符 都 有 O_NDELAY 这 个 属性 ,而 不 仅仅 是 终端 驱动 程序 的 属性 ， 
这 意味 着 这 个 属性 适用 于 磁 鼻 文件 ,也 适用 于 设备 文件 ， 
对 磁盘 文件 来 说 , 非 阻塞 性 意味 着 什么 ? 除了 终端 文件 , 非 阻 塞 性 对 设备 意味 着 
什么 ? 


4, 编程 练习 

6.3 文件 摘 述 符 可 能 处 于 阻塞 或 无 延迟 ( 即 非 阻塞 ) 模 式 。 终 端 驱 动 程序 提供 了 其 便 
选择 , 它 允 许 对 输入 设置 超时 间隔 。 驱 动 程序 termios 结构 体 中 的 控制 字符 数组 c 
_cc[] 在 位 置 VTIME 的 元 素 是 用 来 设置 以 毫秒 为 单位 的 超时 间隔 。 因 此 ,s. c_ee 
LVTIME] = 20 会 将 驱动 程序 的 超时 设置 为 2 s. 
改写 play_again3.c, 使 得 它 使 用 驱动 程序 中 的 超时 特征 ,而 不 再 将 文件 描述 符 置 
于 非 阻 塞 模 式 。 


6.4 在 blay again 中 处 理 信号 。 
(1) 修改 play again3. c, PSE AM BA ES MIL yes 或 no 做 出 响应 
(2) f£ HK play again. c, 使 得 它 在 收 到 键盘 信号 后 ， RARI PEE LOSI 2 iB 
H. 











6.5 修改 rotate.c, 使 得 它 能 够 改变 tty 的 模式 。 修 改过 的 程序 应 该 关闭 规范 模式 ,并 
且 关 闭 回 显 。 然 后 它 读 取 字符 并 显示 字 尺 表 中 的 下 一 个 字母 。 当 用 户 按 下 字母 
“Q* 时 ,程序 应 该 恢复 tty 设置 并 退出 ， 

你 的 程序 应 该 忽略 键盘 信号 或 通过 在 退出 之 前 重 置 驱动 程序 来 对 它们 进行 处 更 ， 
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6. 8 


编写 一 个 行 编辑 器 。 编 写 运行 在 非 规范 模式 程序 的 一 个 问题 是 缺乏 输入 编辑 。 
修改 纠正 过 的 rotate. c, 使 之 支持 字符 种 行 编辑 。 特 别 地 , 当 程 序 收 到 一 个 退 格 或 
删除 字符 时 , 它 从 屏 莫 上 删除 前 一 个 字符 。 为 删除 一 个 字符 ,程序 需 旨 打印 一 个 
退 格 字符 ,一 个 空格 字符 ,然后 又 一 个 退 格 字符 。 

同时 ,修改 程序 ,使 得 它 能 够 像 终 端 驱动 程序 那样 处 理 行 删除 字符 。 也 就 是 ,从 屏 
幕 上 山 除 当前 输入 行 的 所 有 字符 。 

需要 做 什么 以 实现 驱动 程序 的 单词 删除 功能 呢 ? 


修改 程序 sigdemol. ec, 使 得 它 能 够 对 用 户 按 下 的 Ctrl -CC 个 数 进行 计数 。 修 改过 
的 程序 将 显示 OUCH! A A OUCH11, 即 感叹 号 的 个 数 和 处 理 函 数 被 调用 的 次 数 
相等 。 

除了 显示 递增 的 感叹 号 ,程序 应 沪 能 驶 接受 一 个 整数 作为 命令 行 参 数 。 在 用 户 按 
下 Ctrl- 忆 的 次 数 与 那个 整数 相等 之 后 ,程序 庶 该 退出 。 








修改 程序 sigdemol.e, 使 得 它 能 够 询问 用 户 是 否 真 的 要 终止 程序 。 运 行 的 样 例如 
下 所 示 : 
helio 
hello 
Interrupted! OK to quit (y/n)? n 
hello 
hello 
Interrupted! OK to quit (y/n)? y 
5 
如 果 当 程序 在 等 待 用 户 回答 OK to quit (y/n? 问题 时 ,用 户 按 下 Cil- C 将 会 发 
生 什么 事 ? 实现 上 述 程 序 ,并 观察 发 生 的 现象 。 


程序 能 够 使 用 signal 告诉 内 核 它 需要 忽略 特定 的 信号, 像 SIGINT 和 SIGQUIT, 
5j 种 不 同 的 方法 是 一 开始 就 社 绝 这 些 信 和 号 的 产生 。 终 端 驱 动 程序 有 一 个 称 为 
ISIG 的 标志 。 阅 读 手 册 , 以 了 解 这 个 标志 的 用 途 。 然 后 使 用 这 个 标志 重 扎 
sigdemod. c, 

当 修 改过 的 程序 接收 到 从 键盘 以 外 的 地 方 发 送 来 的 SIGINT 信号 时 ,程序 将 做 什 
么 ”学 习 命 令 kill, 并 使 用 kill 发 送 SIGINT 到 关闭 了 ISIG 的 那个 版 本 的 程序 。 


中 断 并 不 总 是 破坏 性 的 。 想 象 你 正在 做 一 个 需要 若干 天 的 项 目 。 你 可 能 收 到 老 
板 询问 工作 进展 的 电话 。 这 些 中 断 是 用 来 调用 状态 报告 的 子 程序 的 ,而 不 是 用 
来 杀 死 进程 。 编 写 一 个 搞 行 耗 时 任务 的 程序。 例如 ,编写 一 个 使 用 较 慢 的 方 
法 寻找 素数 的 程序 。 程 序 需要 跟踪 它 到 目前 为 止 所 找到 的 最 大 的 素数 。 实 现 一 
个 SIGINT 的 处 理 带 函数 ,这 个 淆 数 用 来 显示 它 所 找到 的 素数 的 个 数 以 及 素数 的 
最 大 值 。 

这 个 想法 如 何 运用 在 系统 编程 中 *? 
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在 第 1 章 中 ,实现 了 几 个 版 本 的 more。 那 时 并 不 知道 如 何 控制 终端 驱动 程序 ， 
改进 那个 程序 ,使 名 运行 无 回 显 . 非 规 范 模式 中 ,并 能 对 中 断 和 终止 信号 做 出 正 
确 的 响应 。 


用 户 不 仅 能 够 通过 按键 产生 信号 ,也 能 通过 改变 终端 窗口 的 大 小 产生 信号 。 窗 
口 每 次 改变 大 小 时 , SIGWINCH 就 被 发 送 到 进程 。 按 默认 处 理 , 进 程 将 忽略 
SIGWINCH 信号 ， 编 写 一 个 程序 ,使 得 能 够 在 屏幕 上 打印 满 屏 的 字母 *A"。 鲍 
如 ,如 果 窗 口 有 10 行 20 列 , 程 序 要 显示 字母 “A*200 次 。 当 窗口 大 小 改变 时 , 程 
序 用 字母 "B” 填 充 整个 屏幕 。 下 一 次 ,使 用 *C”, 以 此 类 推 。 当 用 户 接 下 字母 “Q” 
时 ,屏幕 清除 ,程序 退出 。 当 用 户 按 下 其 他 任何 键 时 ,屏幕 从 字母 "A"* 重 新 开始 。 
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概念 与 技巧 

。 REESE (SR SD RUE 

* curses FE. 目标 和 使 用 
* 警告 和 间隔 计时 器 

* 可 靠 的 信号 处 理 

， 可 重 入 代码 .临界 区 
”异步 输入 

相关 的 系统 调用 和 函数 

* alarm, setitimer, getitimer 
* kill. pause 

* sigaction,sigprocmask 


* fentl, aio. read 


7.1 视频 游戏 和 操作 系统 


贝尔 实验 室 的 Dennise Ritchie 和 Ken Thompson 为 了 坛 一 个 叫 伐 《星际 旅行 》 的 视频 游 
3R. TERS T Unix, Ritchie Sik; 

Thompson 在 1969 年 就 开发 了 《星际 旅行 》 这 个 游戏 。 第 一 次 是 在 Multics 操作 系统 上 ,然后 用 Fortran 
移植 到 GECOSCGE 上 运行 的 .… 个 操作 系统 ,后 来 在 Honeywell 635 上 运行 ) 那 是 一 个 由 玩家 在 模拟 的 移 
动 太 阳 系 中 ,根据 屏幕 上 显现 的 环境 引导 飞船 在 不 同 的 行星 或 卫星 上 降落 的 游戏 。GECOS 上 的 这 个 版 本 
在 两 个 重要 方面 并 不 令 人 满意 : 第 一 ,游戏 的 显示 有 些 不 连贯 ,同时 通过 硫 击 命令 来 控制 很 难 浊 握 ;第 二 , 游 

戏 需 要 在 一 台大 型 机 上 大 约 花费 75 美元 的 CPU 时 间 来 运行 。 所 以 不 久 以 后 ,Thompson 找到 一 台 很 少 使 
用 的 PDP-? 计算 机 ,这 人 台 机 器 有 很 棒 的 显示 处 理 轿 , 整个 系统 被 当做 Graphic ll MA, RESTOR 
_ 际 旅行 } 使 之 能 运行 在 这 人 台 机 器 上 。 实 际 上 , 旧 正 的 目标 比 看 上 去 更 加 雄心 勃勃 。 因 为 我 们 抛弃 了 所 有 现 
存 的 软件 ,所 以 不 得 不 写 一 个 浮 点 运算 包 , 显 示 特 性 的 点 序 规格 说 明 , 以 及 -- 个 在 屏幕 角 上 连续 显示 输入 内 
容 的 排 错 子 系统 。 所 有 这 些 都 是 用 汇编 语言 写 的 ,用 - .个 在 GECOS 上 的 交叉 汇编 器 编译 到 PDP-7 的 纸 
"E. 
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星际 旅行 3 尽管 是 一 个 非常 吸引 人 的 游戏 ,但 也 只 是 主要 作为 学 习 复 杂 的 PDP? ERT RAR. 
TALE Thompson 开始 实现 一 个 之 前 就 已 设计 好 的 纸 带 文件 系统 (paper file system) (或 者 说 粉笔 文件 系 
统 即 chalk file system 更 加 合适 )。 在 没有 练习 的 情况 下 试图 建立 一 个 文件 系统 是 非常 困难 的 ,所 以 他 继续 
以 - -个 每 用 失 作 系统 的 其 他 功能 来 充实 自己 的 系统 , 匹 其 是 进程 的 概念 ， 热 后 是 小 部 分 用 户 级 的 工具 : 
复制 .打印 .删除 和 编辑 文件 的 工具 。 当 然 还 有 一 个 笨 单 的 命令 解释 器 (shely。 直 到 此 时 所 有 的 程序 还 是 
E GECOS 上 写 的 :然后 用 纸 逢 转移 到 PDP? 上 ,但 是 一 旦 有 一 个 自己 的 汇编 器 它 就 可 以 支持 自己 了 。 尽 管 
直到 1970 年 Brian Kernighan 才 建 议 使 用 Unixt 某 种 程度 上 有 点 像 Multics 的 双关 闸 ) 来 命名 系统 ,如 今 所 
知 这 个 操作 系统 已 经 泛 生 了 。 i 

帘 频 游戏 和 操作 系统 有 很 多 共同 点 。 在 本 章 中 将 完成 -个 简单 的 视频 游戏 。 通 过 这 个 
例子 来 介绍 更 多 的 Unix 系统 服务 .一些 基本 原则 和 操作 系统 设计 技术 。 

l. 视频 游戏 做 什么 

考 虐 一 个 有 两 个 人 参与 的 星际 旅行 视频 游戏 。 程 序 创立 行星 .流星 ,飞船 和 其 他 物体 的 
影像 ,并 使 它们 移动 。 笠 一 个 物体 有 有 犁 己 的 移动 速度 .方向 劲 力 和 其 他 一 HUE. 物体 之 
间 衬 工作 用 。 一 个 流星 可 能 撞 上 飞船 或 其 他 流星 。 

游戏 同时 要 响应 用 户 输入 。 游 戏 玩家 们 通过 按钮 .鼠标 和 和 轨迹 球 在 任何 时 刻 部 有 可 能 
生成 输入, 程序 必须 在 很 短 的 时 间 里 作出 响应 。 这 些 输入 事件 会 影响 游戏 中 物体 的 属性 。 
通过 按 下 按钮 ,用 户 可 以 增加 飞船 速度 或 是 减少 飞船 质量 。 飞 船 的 变化 金 影 响 它 与 其 他 物 
体 的 作用 方式 。 

2. 视频 游戏 如 何 做 

一 个 视频 游戏 综合 了 一 些 基 本 的 概念 和 原则。 

CD 空间 

族 戏 必须 在 计算 机 屏幕 的 特定 位 置 画 影像 。 程 序 如 何 控制 视频 昂 示 ? 

(2) 时 间 

Be RAS TR] AGE PRE By. LA- PRESE WORT TL TT TE NU. Ré Hr. RE br dup 3 n 
时 间 并 且 在 特定 的 时 间 安 排 事 情 的 发 生 ? 

(3) 中 斯 

程序 在 屏幕 上 平滑 的 移动 物体 ,用 户 可 在 任意 时 刻 产 生 输 人 人。 程序 是 如 何 响应 中 断 的 ? 

(4) 同时 做 几 件 事 

游戏 必须 在 保持 几 个 牺 体 移动 的 网 时 还 机 响应 中 断 。 程 序 是 如 何 同 时 做 密 件 事情 而 不 
被 弄 得 晕 涉 转向 的 ? 

3. 操作 系统 面临 类 伺 的 问题 

操作 系统 同样 要 面 对 这 4 个 问题 。 内 核 将 程序 载 人 内 存 空 间 并 维护 每 个 程序 在 内 存 中 
所 处 的 位 置 。 在 内 核 的 调度 下 ,程序 以 时 间 片 间 昭 的 方式 运行 ,同时 ,内 核 也 在 特定 的 时 刻 
运行 特定 的 内 部 任 备 。 内 核 必 须 在 很 短 的 时 间 内 响应 用 户 和 外 设 在任 何 时 刻 的 输入 。 同 时 
做 玫 件 事情 需要 一 些 技巧 。 内 核 是 如 何 保 证 数据 的 有 序 和 规整 的 ? 

4. RRS MF KERR 

AS BG Se A DE TT] fer Som n fr 3e ob FE LS, OE 4E 
主题 ,将 编写 一 个 基于 字符 终端 的 动画 游戏 。 

为 什么 是 基于 字符 的 图 形 翼 面 ? 
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为 什么 不 用 强大 的 XI11 来 编程 或 者 是 java 来 给 图? 这 里 有 很 多 原因 。 首 先 ,基于 字符 
的 游戏 除了 每 个 像素 大 些 外 ,其 他 与 高 分 辩 率 的 图 形 界面 游戏 非常 相似 。 其 次 是 可 移植 性 。 
字符 图 形 欠 面 游戏 只 需要 - -个 终端 模拟 器 和 一 个 连接 ,这 些 是 每 个 系统 都 提供 的 。 第 一 ,在 
绘图 上 省 下 来 的 时 间 可 以 用 在 系 统 编 程 上 。 尽 管 如 此 ,如 果 喜 欢 更 好 的 图 形 界面 ,网 站 上 有 
这 个 游戏 的 义 Windows 版 本 。 


7.2 任务 : 单 人 弹 球 游戏 (Pong) 


现在 开始 了 。 本 章 的 主要 任务 是 实现 一 个 在 游戏 房 和 家 庭 中 常见 的 经 典 游戏 一 Bie 
游戏 。 图 ?. 1 显示 了 它 的 3 个 主要 元 素 , 墙 , 球 和 挡 板 。 游戏 的 概要 描述 如 下 ， 

1) 球 以 一 定 的 速度 移动 ; 

(2) 球 碰 到 墙壁 或 挡 板 会 被 弹 回 ; 

G) 用 户 按 按钮 来 控制 挡 板 上 下 移动 。 


| 
| L- Hik: 用户 控 制 
| 一 球 : 屏幕 |- 弹 来 强 去 
| 目标 : 不 让 球 飞 出 去 
=e. "nu i 


图 7.1 单 人 视频 游戏 


写 这 个 游戏 需要 了 解 如 何 管理 屏幕 ,时间 和 和 中断, 还 要 理解 如 何 安 全 地 同时 做 几 件 事 
情 。 下 面 一 样 一 样 来 学 ， 








7.3 屏幕 编程 : curses 库 


curses 库 是 一 组 沙 数 ,程序 员 可 以 用 它们 来 设置 光标 的 位 置 和 终端 屏幕 上 显示 的 字符 样 
X. curses 库 最初 是 由 UCB 的 开发 小 组 开发 的 。 大 部 分 控制 终端 屏幕 的 程序 使 用 eurses。 
曾经 由 一 组 简单 的 函数 组 成 的 库 现在 包括 了 许多 复杂 的 特性 。 这 里 将 使 用 其 中 很 少 -部 分 
的 功能 。 


7.3.1 介绍 curses 


curses 将 终端 让 幕 看 成 是 由 字符 单元 组 成 的 网 格 , 每 一 个 单元 由 ( 行 、. 列 ) 坐 标 对 标示 。， 
坐标 系 的 原点 是 屏幕 的 左上 角 , 行 坐标 自 上 而 下 递增 , 列 坐 标 自 左 向 右 递 增 、 图 7.2 显示 了 
curses Bé RE. 

curses 具有 的 图 数 包 括 可 以 将 光标 移动 到 屏幕 上 任何 行 、. 列 单元 , 添 as HE FE BA BE RE ok 
从 屏幕 上 删除 字符 ,设置 字符 的 可 视 属 性 (如 颜色 .亮度 ), 建 立 和 控制 窗口 以 及 其 他 文本 区 
域 。 用 户 手册 有 curses 的 所 有 函数 的 详细 描述 。 这 里 将 用 到 其 中 的 9 个。 
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fr addstr d "hello" 
图 7.2 curese WRH HI 
基本 curses di 2X 
initscr() 初始 化 curses 库 和 uy l 
endwin() XB] curses HEE tty 
refresht? 使 屏幕 按照 你 的 意图 显示 
movetr, c) 移动 光标 到 屏幕 的 Cr,c? 位 置 
addstr(s) 在 当前 位 置 画 字符 串 s 
addch(c) TE SABA f E FF c 
clear() ia 
standout() 启动 standout 模式 (一 般 全 屏幕 反 色 } 
standend(? XH] standout 模式 





curses 例 1; hellol.c 
第 一 段 程序 展示 了 一 个 curses 程序 的 基本 逻辑 ， 


/* hellol.e 


x purpose show the minimal calls needed to use curses 

* outline initialize, draw stuff, wait for input, quit 
f 

xj 


# include <stdio.h> 


` # include -curses.h-- 


main() 

1 
initscr() ; /* turn on cursess/ 

/* send requests */ 

clear(}; /* clear screen x/ 
move(10,205; /* row10,col20 x/ 
addstr("Hello, world"); /* add a string */ 
move(LINES- 1,0); /* move to TL «/ 
refresh(); /* update the screen «/ 


getch(); /* wait for user input «/ 
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enduwin(), /x turn off curses */ 


! 
编译 和 运行 程序 非常 简单 : 


$ cchellol.c ~ l curses - o hellol 
$ .fhelloi 


AL te 


输出 如 图 7.3 所 从。 这 个 程序 在 连接 到 任何 Unix 系统 的 任何 终端 上 都 能 运行 。 


Hello, World 





E]7.3 第 一 个 基于 curses 的 程序 


curses ffi 2: hello2.c 
将 curses 函数 与 循环 .变量 和 其 他 函数 组 合 在 一 起 会 产 和 更 复杂 的 显示 效果 。 预 测 以 
下 第 2 个 例子 的 输出 : 


/* hello2.c 
* purpose show how te use curses functions with a loop 
* outline initialize, draw stuff, wrap up 


] 


x, 


# include stdio, h> 


# include  -curses.h7 


maint) 
i 
int i; 
initscr(); /* turn on curses x/ 
clear(); /* draw some stuff «/ 
for (i= 0; ic LINES; i++ }{ /* ina loop «/ 
move( i, iti); 
if t i%2 == 12 
standout) ; 


addstr( "Hello, world") 
if €i&2 == 1) 
standend(); 


fi 
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refresh(); /* update the screen */ 

getch() ; /* wait for user input*/ 

endwin(); /* reset the tty etc */ 
} 


编译 并 运行 它 。 你 的 预测 正确 吗 ? 
7.3.2 curses 内 部 : 虚拟 和 实际 屏幕 


refresh 函数 做 了 些 什 么 ? 试验 一 下 : 注释 掉 该 行 ,重新 编译 ,运行 程序 。 结 果 是 什么 都 
没有 出 现在 屏幕 上 。 

curses 设计 成 为 能 够 在 不 阻塞 通信 线路 的 情况 下 更 新 文本 屏幕 。curses 通过 虚拟 屏幕 
(如 图 7. 4 所 示 ) 来 最 小 化 数据 流量 。 


addstr 写 人 屏幕 缓存 屏幕 缓存 


真实 屏幕 





refresh 更 新 真实 屏幕 
7.4. Curses 保持 真实 屏幕 的 副本 


真实 屏幕 是 眼前 的 一 个 字符 数组 。curses 保留 了 屏幕 的 两 个 内 部 版 本 。 一 个 内 部 屏幕 
是 真实 屏幕 的 复制 。 另 一 个 是 工作 屏幕 ,其 上 记录 了 对 屏幕 的 改动 。 每 个 函数 ,比如 move, 
addstr 等 都 只 在 工作 屏幕 上 进行 修改 。 工 作 屏 幕 就 像 磁 盘 缓存 ,curses 中 的 大 部 分 的 函数 都 
只 对 它 进行 修改 。 

refresh 函数 比较 工作 屏幕 和 真实 屏幕 的 差异 。 然 后 refresh 通过 终端 驱动 送出 那些 能 
使 真实 屏幕 与 工作 屏幕 一 致 的 字符 和 控制 码 。 例 如 ,如 果真 实 屏幕 的 左上 角 是 Smith, 
James, 然 后 用 addstr 把 Smith, Jane 放 在 相同 的 位 置 , 调 用 refresh 也 许 只 是 用 n 和 空格 替换 
T James 中 的 m 和 ss。 这 种 只 传输 改变 的 内 容 而 不 是 影像 本 身 的 技术 被 用 在 视频 流 中 。 


7.4 时 钟 编 程 : sleep 


为 了 写 一 个 视频 游戏 ,需要 把 影像 在 特定 的 时 间 置 于 特定 的 位 置 。 用 curses 把 影像 置 
于 特定 的 位 置 。 然 后 在 程序 中 添加 时 间 响 应 。 第 1 步 使 用 系统 函数 sleep. 
动画 例子 1: hello3. c 


/* hello3.c 


* purpose using refresh and sleep for animated effects 
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* outline initialize, draw stuff, wrap up 
xf 
F include <0 stdio. hz» 


E include «curses. hz» 
maint) 
5 

int i; 

initscr(); 


clear(); 
for(i- 0; i<{ LINES; it+ }: 





move( i, iti); 

if (i%2 == 1} 
standout(); 

addstr("Hello, world"); 


if (1i%2 == 1) 
standend() ; 
sleepi l); 


refreshi); 
i 
endwin(); 
当 编 译 并 运行 这 个 程序 的 时 想 , 将 看 到 hello FFRPERRA E RESI BR. ARE 
加 一 行 , 反 色 和 正常 星矢 交替 出 现 。 为 什么 在 每 次 循环 结 东 都 要 调用 refresh? 如 果 不 这 样 
会 有 什么 效果 ? 
动画 例子 2: hellot. c 


/* hello4.c 























* purpose show how to use erase, time, and draw for animation 
sf 
# include -<stdio.h> 


# include «curses. h> 


maint > 


initser(}; 
clear(); 
for(i-0; 


; isTLINES; i++ Yt 

movel i, iti}; 

if €i%2 == 1) 
standout}; 

addstr( "Hello, world"); 


if(i*2--1) 
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standend(); 
refresh(); 
sleep(1); 
move(i,it i); /* move back «/ 
addstr(" "J; /* erase line «/ 


} 


endwin() + 


} 


hello4 创造 移动 的 假象 . 字符 串 沿 着 对 角 线 缓慢 向 下 移动 。 秘 诀 是 先 在 一 个 地 方 画 字 
符 串 ,睡眠 1 秘 钟 ,然后 在 原来 的 地 方面 空 字符 申 以 删除 原 有 影像 ,最 后 将 输出 位 置 推进 。 注 
意 在 两 次 请 求 之 后 通过 调用 refresh 来 保证 每 次 循环 后 旧 的 影像 消失 ,新 的 影像 显示 。 图 
7.5 是 屏幕 的 一 个 快照 ， 


™ ba 
Hello, world 





图 7.5 FARRER TE 


下 一 个 例子 将 字符 串 在 屏幕 四 壁 弹 来 弹 去 。 
动画 例子 3， hello5. c 


/* hello5.c 
* purpose bounce a message back and forth across the screen 
* compile cc hello5.c ~ icurses - o hello5 
af 

# include <Ccurses. h> 


# define LEFTEDGE 10 
# define  RIGHTEDGE 30 


# define ROW 10 

maint} 

{ 

char message = "Hello"; 
char blank = " ws 
int dir = +1; 


int pos = LEFTEDGE 


initscr(); 


clear(); 
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while(1){ 
move( ROW , pos) ; 
addstr¢ message }+ ¿x draw string */ 
move(LINES — 1,COLS- 12; /* park the cursor */ 
refresh(); fx show string */ 


sleep(1); 
movet ROW, pos) ; /* erase sLring */ 
addstr( biank ); 
. pos += dir; /* advance position */ 
if ( pos “>= RIGHTEDGE ) /* check for bounce +/ 
dir = -1; 
if ( pos <= LEFTEDGE ) 


dir = +1; 


变量 dir 用 来 控制 宁 符 趾 移动 的 速度 。 当 dir 是 一 1 时 ,字符 申 每 一 秒 向 右 移动 一 州 。 
当 dir 是 一 1 时 ,字符 串 每 秒 向 左 移动 一 列 。 改 变 dir 的 符号 就 改变 了 字符 串 移 动 的 方向 。 
图 7.6 是 其 一 特定 时 刻 屏 幕 的 快照 。 





ZEE Helle, world 





图 7.6 宁 符 申 弹 来 弹 去 


现在 该 如 何 做 ? 

现 在 岛 能 够 写 出 一 个 像样 的 动作 类 视频 游戏 有 多 远 ? RAAB TOW E E ae E i e 
方面 宁 符 申 , 也 知道 了 了 如何 通 过 曾 , 接 掉 和 重 画 之 间 插 入 时 延 米 创 造 动 画 效 果 。 迄 今 实 现 的 
程序 还 不 错 , 只 是 ; 

(OD 一 种 钟 的 时 延 太 长 ,党 要 更 精确 的 计时 器 ; 

(2) 需要 增加 用 户 输入 。 

这 些 问 题 引 出 新 的 话题 : 用 时 钟 和 高 级 信号 编程 。 然 后 ,将 再 次 同 到 这 个 游戏 。 


7.5 上 时钟 编程 1: Alarms 


程序 可 到 以 不 同 的 万 式 使 用 时 钟 。 可 以 用 来 在 执行 流 中 加 入 时 延 。 前 而 的 3 个 例子 里 
用 sleep 加 入 时 延 。 时 钟 的 另 一 个 用 途 是 调度 一 个 将 来 要 做 的 件 务 ,就 像 所 好 一 个 者 鸡蛋 的 
定时 内 ,然后 干 别 的 事情 直到 定时 器 鸣叫 。 同 样 的 日 的 ,Unix 提供 alarm, 
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7.5.1 添加 时 延 : sleep 
为 了 在 程序 中 添加 时 延 ,使 用 sleep MAX: 


sleep(n) 


sleep(n) 将 当前 进程 挂 起 ” 秒 或 者 在 此 期 间 被 一 个 不 能 忽略 的 信号 的 到 达 所 唤醒 。 


7.5.2 sleep() 是 如 何 工 作 的 : 使 用 Unix 中 的 Alarms 


sleep PR f 工作 机 理 与 你 想 睡 定 长 时 间 的 觉 一 样 ; 
(1) 设置 闹钟 到 你 想 睡 的 秒 数 ; 


(2) 睡觉 ,直到 病 钟 的 铃声 响起 。 
图 7.7 是 这 个 机 制 的 示意 图 。 系统 中 的 每 个 进程 都 有 一 个 私有 的 闹钟 (alarm clock), 


这 个 闹钟 很 像 一 个 计时 器 ,可 以 设置 在 一 定 秒 数 后 闹 铃 。 时 间 一 到 ,时 钟 就 发 送 一 个 信号 


SIGALRM 到 进程 。 除 非 进 程 为 SIGALR Uri ps COR Ens XX Chandler) ,否则 信号 将 杀 死 这 


个 进程 。sleep 函数 由 3 个 步骤 组 成 : 
1. 为 SIGALRM 设置 一 个 处 理 函 数 ; 


2. 调用 alarm(num seconds) ; 


3. 调用 pause, 

sleep PR cR an fo] THE ig. 
Signal(SIGALRM, handler) ; 
alarm(n); 
pause(); 





每 个 进程 有 自己 的 计时 器 
图 7.7 一 个 进程 设置 一 个 闹钟 后 挂 起 


系统 调用 pause 挂 起 进程 直到 信和 号 到 达 。 任何 信号 都 可 以 唤醒 进程 ,而 非 仅 仅 等 待 
SIGALRM。 以 上 想法 总 结 为 以 下 代码 : 


/* sleepl.c 
* purpose 
* usage sleepl 
* outline sets handler, sets alarm, pauses, then returns 
x/ 

f include <stdio.h> 
# include <signal. h> 
// # define SHHHH 


show how sleep works 


main() 


{ 
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void wakeup(int) ; 


printf("about to sleep for 4 seconds\n") ; 


Signal(SIGALRM, wakeup) ; /* catch it */ 
alarm(4) ; /* set clock «/ 
pause(); /* freeze here */ 


printf("Morning so soon? Mn"); /* back to work */ 

) 

void wakeup(int signum) 

( 

+ ifndef SHHHH 

printf( "Alarm received from kernel\n") ; 

# endif 

} 

这 里 调用 signal 设置 SIGALRM 处 理 函 数 , 然 后 调用 alarm 设置 一 个 4 秒 的 计时 器 ,最 
后 调用 pause 等 待 。 

调用 pause 的 目的 是 挂 起 进程 直到 有 一 个 信号 被 处 理 。 当 计时 器 计时 4 秒 钟 以 后 ,内 核 
送出 SIGALRM 给 进程 ,导致 控制 从 pause 跳 转 到 信号 处 理 函 数 。 在 信号 处 理 程序 中 的 代码 
被 执行 ,然后 控制 返回 。 当 信号 被 处 理 完 后 ,pause 返回 ,进程 继续 。 图 7. 8 总 结 了 pause 的 
执行 过 程 。 






pause ( ) 系 统 调用 导致 进 
程 阻塞 直到 信号 被 处 理 


7.8 进入 处 理 函 数 的 执行 流 





下 面 是 alarm 和 pause 的 细节 : 
alarm 
目标 设置 发 送信 号 的 计时 器 
头 文件 # include — unistd, h> 
函数 原型 unsigned old = alarm(unsigned seconds) 
参数 seconds 等 待 的 时 间 CEP) 
返回 值 p. 如 果 出 错 


old 计时 器 剩余 时 间 








第 7 章 事件 驱动 编程 : 编写 一 个 视频 游戏 * 191 。 





alarm 设置 本 进程 的 计时 器 到 seconds 秒 后 激发 信号 。 当 设 定 的 时 间 过 去 之 后 ,内 核发 
送 SIGALRM 到 这 个 进程 。 如 果 计 时 器 已 经 被 设置 ,alarm 返回 剩余 秒 数 (注意 : 调用 alarm 
(0) 意 味 着 关 掉 闹钟 )。 


pause 








目标 等 待 信号 

头 文件 # include — unistd, h> 
函数 原型 result — pause() 

参数 没有 参数 

返回 值 总 是 一 1 


pause 挂 起 调用 进程 直到 一 个 信号 到 达 。 如 果 调 用 进程 被 这 个 信号 终止 ,pause 没有 返 
回 。 如 果 调 用 进程 用 一 个 处 理 函 数 捕获 ,在 控制 从 处 理 函数 处 返回 后 pause 返回 。 这 种 情况 
下 errno 被 设置 为 EINTR, 


7.5.3 调度 将 要 发 生 的 动作 


计时 器 的 另 一 个 用 途 是 调度 一 个 在 将 来 的 某 个 时 刻 发 生 的 动作 同时 做 些 其 他 事情 。 调 
度 一 个 将 要 发 生 的 动作 很 简单 ,通过 调用 alarm 来 设置 计时 器 ,然后 继续 做 别 的 事情 。 当 计 
时 器 计时 到 0, 信 号 发 送 ,处 理 函 数 被 调用 。 


7.6 时钟 编 程 2: 间隔 计时 器 


Unix 很 早 就 有 sleep 和 alarm。 它们 所 提供 的 时 钟 精度 为 秒 , 对 于 很 多 应 用 来 说 这 个 精 
度 是 不 能 让 人 满意 的 。 后 来 一 个 更 强大 和 使 用 广泛 的 计时 器 系统 被 添加 进来 。 这 个 新 的 系 
统 使 用 一 个 被 称 做 为 间隔 计时 器 (interval timer) 的 概念 ,有 更 高 的 精度 。 而 且 每 个 进程 都 有 
3 个 独立 的 计时 器 而 不 是 原来 的 一 个 。 这 还 不 是 全 部 。 每 个 计时 器 都 有 两 个 设置 ; 初始 间 
隔 和 重复 间隔 设置 。 新 的 系统 还 支持 alarm 和 sleep, 它们 对 大 多 数 应 用 来 说 已 经 足够 了 。 
图 7.9 是 它 的 一 个 相应 的 示意 图 。 


每 个 进程 有 三 人 计时 器 


每 个 计时 器 有 两 个 设置 ， 
到 第 一 个 信号 的 时 间 和 两 次 
信号 间 的 时 间 间 隔 





真实 虚拟 实用 
图 7.9 每 个 进程 有 3 个 计时 器 


可 以 用 这 个 新 的 系统 来 添加 时 延 和 为 事件 定时 。 
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7.6.1 添加 精度 更 高 的 时 延 : usleep 

为 了 添加 精度 更 高 的 时 延 ,使 用 usleep: 

usleep(n) 

usleep(n) 将 当前 进程 挂 起 » 微 秒 或 者 直到 有 一 个 不 能 被 忽略 的 信号 到 达 。 
7.6.2 三 种 计时 器 : 真实 .进程 和 实用 


进程 可 以 以 3 种 方式 来 计时 。 考 虑 一 个 程序 在 运行 了 30 s 后 结束 。 在 一 个 分 时 系统 
中 ,这 个 程序 不 是 一 直 在 运行 的 ,其 他 的 程序 与 它 共 享 处 理 器 。 图 7. 10 显示 了 一 种 可 能 性 。 





睡眠 
时 间 : 真实 30s 虚拟 10s (用 户 态 ) ”实用 15s (用 户 十 核心 态 ) 


图 .7. 10 时间 用 在 哪里 


图 7. 10 显示 从 0 到 5 s 进程 在 用 户 模式 运行 , 接着 从 5 到 15 s 睡眠 ,然后 在 核心 态 运行 
到 20 s 睡眠 ,如 此 这 般 。 显 然 从 开始 到 结束 ,程序 使 用 了 10 s 的 用 户 时 间 .5 s 的 系统 时 间 。 
并 显示 了 3 种 时 间 : 真实 时 间 、 用 户 时 间 和 用 户 时 间 十 系统 时 间 - 内 核 提供 计时 器 来 计量 这 
3 种 类 型 的 时 间 。'3 类 计时 器 的 名 字 和 功能 如 下 : 

(1) ITIMER REAL 

这 个 计时 器 计量 真实 时 间 ,如 同 手表 记录 时 间 。 也 就 是 说 不 管 程序 在 用 户 态 还 是 核心 
态 用 了 多 少 处 理 器 时 间 它 都 记录 。 当 这 个 计时 器 用 尽 , 发 送 SIGALRM 消息 . 

(2) ITIMER_VIRTUAL 

这 个 计时 器 就 像 美 式 橄榄 球 中 用 的 计时 方法 ,只 有 进程 在 用 户 态 运 行 时 才 计 时 。 虚拟 
计时 器 (virtual timer) ff] 30 s 比 实际 计时 器 (real timer) 的 30s 要 长 。 当 虚拟 计时 器 用 尽 , 发 
送 SIGVTALRM 消息 。 

(3) ITIMER_PROF 

这 个 计时 器 在 进程 运行 于 用 户 态 或 由 该 进程 调用 而 陷入 核心 态 时 计时 。 当 这 个 计时 器 
用 尽 ,发 送 SIGPROF 消息 。 


7.6.3 两 种 间隔 : 初始 和 重复 
医生 给 你 一 些 药丸 并 告诉 你 :“ 过 一 个 小 时 吃 第 一 粒 , 然 后 每 隔 4 个 小 时 吃 一 粒 .” 你 需 
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要 设置 计时 器 到 1 个 小 时 ,然后 在 每 次 时 尽 后 再 设置 为 4 个 小 时 。 每 个 间隔 计时 器 的 设置 都 

有 这 样 两 个 参数 : 初始 时 间 和 重复 间隔 。 在 间隔 计时 器 用 的 结构 体 中 初始 时 间 是 it_value， 

重复 间隔 是 it_interval。 如 果 不 想 要 重复 这 一 特征 ,将 it interval 设置 为 0。 要 把 两 个 时 钟 
都 关 掉 , 设 it_value W 0, 


7.6.4 用 间隔 计时 器 编程 


程序 中 使 用 alarm 不 难 , 只 要 传 给 alarm 秒 数 就 可 以 了 。 程 序 中 使 用 间隔 计时 器 要 
复杂 一 点 ,要 选择 计时 器 的 类 型 ,然后 需要 选择 初始 间隔 和 重复 间隔 ,还 要 设置 在 struct 
itimerval 中 的 值 。 比 如 ,为 了 使 用 间隔 计时 器 来 提醒 你 按 7. 6. 3 节 规 定 的 计划 吃 药 , 设 
置 it_value 为 1 小 时 ,设置 it_interval 为 4 小 时 ,然后 将 这 个 结构 体 通过 调用 setitimer f£ 
给 计时 器 。 为 了 读 取 计时 器 设置 ,使 用 getitimer。 图 7.11 是 系统 响应 的 示意 图 。 


struct itimerval ~ æ 


getitimer ( ) 





图 7.11 读 写 计时 器 设置 


1. 间隔 计时 器 例子 : ticker demo.c 
程序 ticker demo. c 演示 了 如 何 使 用 一 个 间隔 计时 器 : 


/* ticker demo.c 
* demonstrates use of interval timer to generate reqular 
* signals, which are in turn caught and used to count down 
x/ 


i include <stdio.h> 

f include <sys/time. h> 
# include <signal. h> 
int main() 

{ 


void countdown( int); 


Signal(SIGALRM, countdown); 
if ( set ticker(500) == -1) 


perror("set ticker"); 
else 
while( 1 ) 
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pause(); 


return 0; 


void countdown(int signum) 


i 


static int num = 10; 

printf(" $d.. ", num-— ); 

fflush(stdout); 

if C num — 0 3f 
printf("DONE! \n"); 


exit(0); 


‘x [from set ticker.c] 

* get ticker( number of milliseconds ) 

* arranges for interval timer to issue SIGALRMs at regular intervals 
* returns - 1 on error, 0 for ok 

* arg in milliseconds, converted into whole seconds and microseconds 
* note, get ticker(0) turns off ticker 


ES 


int set ticker( int n msecs ) 
1 
struct itimerval new timeset; 


long n sec, n usecs; 


n sec = n msecs / 1000 ; /* int part «/ 
n üsecs = ( n msecs & 1000) «x 1000L; /* remainder «/ 
new timeset. it interval.tv sec - n sec; feset reload */ 
new timeset.it interval.tv usec- n usecs; /«new ticker 
valuex/ 
new timeset.it value.tv sec = n sec; /*store thigs/ 
new timeset.it value.tv usec = n_usecs; /sand this / 


return setitimer(ITIMER REAL, &new timeset, NULL); 


来 看 看 ticker demo. c 的 程序 流程 。-- 开 始 使 用 signal 设置 函数 countdown 来 处 理 
SIGALRM 信和 号。 然后 通过 set ticker 来 设置 微 秒 数 ， 

set ticker 通过 装载 初始 间 隐 和 重复 间隔 设置 间隔 计时 器 。 每 个 间隔 是 由 两 个 值 组 成 ; 
秘 数 和 微 秘 数 , 这 就 像 实数 的 整数 部 分 和 小 数 部 分 。 计 时 器 开始 计时 ,控制 返回 到 main. 
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回 到 main,ticker demo. c 进入 一 个 无 尽 的 循环 ,其 间 调 用 pause。 每 过 大 约 500 us 1 
制 跳 转 到 countdown 函数 。countdown 将 一 个 静态 变量 的 值 递 减 ,打印 一 条 消息 ,通常 情况 
下 返回 调用 者 。 当 变量 num 达到 0 时 ,countdown 调用 exit. 

当然 ,main 不 是 一 定 要 调用 pause 的 。 主 程序 可 以 做 些 其 他 更 有 趣 的 事情 ,这 样 在 每 个 
预定 的 时 刻 还 是 会 跳 转 到 countdown 的 。 

间隔 计时 器 的 设置 是 通过 struct itimerval 来 完成 的 。 这 个 结构 类 型 包括 初始 间隔 和 重 


复 间 隔 , 两 者 存储 在 struct timeval 中 : 


struct itimerval 
{ 
struct timeval it_value; /* time to next timer expiration*/ 
struct timeval it interval; /x reload it value with this */ 
) 
struct timeval | 
time t tv sec /* seconds*/ 
suseconds t tv usec; /* and nicroseconds*/ 


} 


不 同 的 Unix (RAS, struct timeval 的 细节 可 能 有 些 差异 。 查 一 下 你 的 系统 的 相应 手册 和 


关 交 件 。 
7.12 显示 了 结构 中 各 成 员 的 关系 ,图 7.13 显示 了 如 何 载 人 数据 以 使 第 一 次 计时 器 到 


达 时 间 为 60. 5 s, 然 后 每 240. 25 s 重复 一 次 。 





ITIMER_REAL ITIMER_VIRTUAL ITIMER_PROF 
it vawe [ [7] it vale [ T ] 
item [T ) it interval 7 







struct itimerval struct timeval 
每 个 计时 器 有 两 个 设置 : 剩 下 的 时 间 和 struct timeval 有 两 个 成 员 
重复 时 间 . 这 两 个 设置 由 struct timeval 变量 : 秒 数 和 微 秒 数 
中 的 两 个 成 员 变 量 表示 


图 7.12 间隔 计时 器 内 部 











* 196 > Unix/Linux 编程 实践 教程 

















a HIMERORTAL ;个 例子 中 将 记录 真实 时 间 
il value 60 500000 | Bis] TERT ABIRE 60.55 
i = | BRAI- ARD. Aine 




















- a 
it interval 240 259000 
| tv sec fv see 


WA 24025s ffi ias. 








BE 7.13 秘 和 微 秘 
2. 系统 调用 小 结 


一 l o O 











getitimer , setitimer 
目标 LE ae i EB 
头 文件 Kincdude <sys/time ho —— i 
函数 原型 i result - getitimer(int which, 


struct itimerval * val); 
result = scititimertint which, 
const struct itimerval * newval, 


struct iumerval * oldvab ; 





参数 vehich 获取 或 设置 的 计时 器 
val 向 当前 设置 值 的 指针 


newval — 指向 要 被 设置 值 的 指 峙 
oldval 指向 被 替换 的 设置 值 的 指针 





返回 值 一 1 ist 
0 成 功 
a OO S L BA OOO 
getitimer 将 某 个 特定 计时 器 的 当前 设置 读 到 val 指向 的 结构 中 。setitimer 将 计时 器 设 
BA newval 指向 的 结构 的 值 。 如 果 oldval 不 指向 null, 之 前 计时 器 的 设 定 将 被 复制 到 
oldval 指向 的 结构 中 。 


which 的 值 指定 将 要 被 读 或 更 新 的 计时 器 。 计 时 器 的 编码 分 别 是 ITIMER REAL, 
ITIMER VIRTUAL fl ITIMER PROF, 


7.6.5 计算 机 有 几 个 时 钟 


如 何 才 能 让 每 个 进程 有 3 个 独立 的 计时 器 ? 有 些 系统 同时 有 几 百 个 进程 在 运行 。 计 算 
机 里 有 几 百 个 独立 的 时 钟 吗 ? 不 ,一 个 系统 只 需要 一 个 时 钟 来 设置 节拍 。 这 就 像 用 一 个 节 
拍 器 来 为 一 个 弦 乐 四 重奏 乐团 定 扒 子 ,或 者 像 有 规律 摆动 的 钟 把 驱动 一 个 古老 钟表 里 的 几 
根 指针 。 一 个 硬件 时 钟 的 脉冲 是 计算 机 里 惟 ~- 需 要 的 时 钟 。 如 何 只 用 一 个 时 钟 在 设置 一 个 
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进程 的 私有 计时 器 为 5 s 的 同时 又 设置 另 一 个 进程 的 私有 计时 器 为 12 s? 

一 个 古老 的 时 钟 是 如 何 让 时 针 、 分 针 和 秒针 六 不 同 的 速度 转动 的 ? 它们 的 答案 是 一 样 
的 。 每 个 进程 设置 自己 的 计数 时 间 , 操 作 系统 在 每 过 一 个 时 间 片 后 为 所 有 的 计数 器 的 数值 
做 递减 。 一 个 实际 的 例子 可 以 澄清 这 些 概 念 。 

考虑 两 个 进程 : 进程 A 和 进程 B。 进 程 A 设置 它 的 真实 计时 器 (real timer) 为 5 s, 进 程 
B 设置 它 的 真实 计时 器 为 123。 为 了 使 数字 看 起 来 简单 ,假设 系统 时 钟 每 秒 跳 100 T. ME 
程 A 设置 它 的 时 钟 时 ,内 核 设置 它 的 计数 器 为 500。 当 进程 B 设 置 它 的 时 钟 时 ， 内 核 设 置 它 
的 计数 器 为 1200, 如 图 7. 14 所 示 。 





每 个 进程 的 间隔 计时 器 一 个 真实 的 时 钟 


每 个 进程 通过 调用 alarm 来 设置 它 的 私有 计时 器 。 内 核 在 每 次 
收 到 时 钟 中 断 的 时 候 更 新 所 有 的 进程 计时 器 


7.14 两 个 计时 器 .一 个 时 钟 


每 当 内 核 收 到 系统 时 钟 脉 冲 , 它 遍历 所 有 的 间隔 计时 器 ,使 每 个 计数 器 减 一 个 时 钟 音 
位 。 当 进程 A 的 计数 器 达到 0 的 时 候 ,意味 着 已 经 有 500 时 钟 节拍 过 去 了 ,内 核发 送 
SIGALRM 给 进程 A。 如 果 进 程 A 已 经 设置 了 计时 器 的 it_interval 值 ,内 炉 将 这 个 值 复 制 到 
it_value 计数 器 ,否则 内 核 就 关 掉 这 个 计时 器 。 

再 过 一 会 ,内 核 将 进程 B 的 计数 器 也 减 到 0, 相 应 地 向 进程 B 发 出 信和 号。 如 果 B 设置 了 
计时 器 的 重 载 值 (reload value) ,内 核 就 设置 it_value 为 相应 的 值 ,然后 继续 处 理 下 一 个 计 
时 器 。 

通过 这 个 简单 的 机 制 , 每 个 进程 就 可 以 设置 自己 的 计时 器 。 这 个 计时 器 在 进程 睡眠 的 
时 候 也 在 倒计时 。 

其 他 的 两 个 计时 器 如 何 工作 ? 它们 不 是 固定 的 倒计时 ,而 仅仅 在 进程 处 于 某 个 特定 状 
态 时 倒计时 。Linux 源 代码 清楚 地 给 出 了 它们 是 如 何 实现 的 。 


7.6.6 计时 器 小 结 


一 个 Unix 程序 用 计时 器 来 挂 起 执行 和 调度 将 要 采取 的 动作 ，。 一 个 计时 器 是 内 核 的 一 
种 机 制 。 通过 这 种 机 制 ,内 核 在 一 定 的 时 间 之 后 向 进程 发 送 SIGALRM。alarm 系统 调用 在 
特定 的 实际 秒 数 之 后 发 送 SIGALRM 给 进程 。setitimer 系统 调用 以 更 高 的 精度 控制 计时 
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器 ,同时 能 够 以 国定 的 时 间 间 隔 发 送信 和 号 。 
现在 已 经 知道 如 何在 程序 中 计时 了 。 要 实现 视频 游戏 还 需要 一 项 技术 : 管理 中 断 ， 


7.7 信号 处 理 1: 使 用 signal 


这 个 游戏 必须 处 理 中 断 。 可 能 当 用 户 按 下 一 个 键 的 时 候 程 序 正 在 移动 一 幅 图 片 , 或 者 
在 处 理 一 个 用 户 输入 的 时 候 , 计 时 器 发 来 一 个 信号 。 如 果 游 戏 支 持 双人 游戏 , 当 … 个 人 按键 
的 时 候 程 序 可 能 正在 处 理 另 一 个 人 的 输 人 。 

中 断 处 理 是 操作 系统 和 系统 软件 的 关键 部 分 ，Unix 中 的 软件 中 断 被 称 为 信和 号 
(signals)。 现 在 需要 深入 理解 信号 处 理 。 作 为 开始 , 先 回顾 一 下 早期 的 Unix 信号 处 理 模 
型 ,然后 看 看 它 有 些 什 么 问题 ,最 后 再 学 习 POSIX( Unix 型 可 移植 操作 系统 接口 ) 的 信号 处 
PEU, 


7.7.1 时 期 的 信号 处 理 机 制 


各 种 事件 促使 内 核 向 进程 发 送信 号 。 这 些 事 件 包 括 用 户 的 击 键 、. 进 程 的 非法 操作 和 计 
时 器 到 时 。 第 6 章 介绍 了 早期 的 信号 处 理 模型 一 个 进程 调用 signal 在 以 下 3 种 处 理 信和 号 
的 方法 之 中 选择 : 

C1) 默认 操作 (一 般 是 终于 进程 ) ,比如 ,signal(SIGAILRM ,SIG_DFL) 

(2) 忽略 信号 ,比如 :signal(SIGALRM,SIG_IGMN) 

(3) 调用 一 个 函数 ,比如 ,signal(SIGALRM ,handler) 


7.7.2. 处 理 多 个 信号 


如 果 只 有 一 个 信号 要 处 理 , 原 始 的 信和 号 处 理 模 型 足以 应 舍 。 如 果 有 多 个 信和 号 到 达 会 发 
生 什 么 事情 ? 如 果 响 应 定 尽 为 终止 (termination) 或 者 是 忽略 (Cignore) , 那 结果 很 清楚 。 但 是 
如 果 是 调用 (invoke) 一 个 函数 来 响应 ,那么 结果 就 不 那么 明显 了 。 

1l. +S 

信号 处 理 函 数 有 点 像 捕 鼠 器 。 一 个 信号 意味 着 什么 具有 破坏 性 的 事情 发 生 ,并 被 捕获 。 
当 信 和 号 或 老鼠 被 捕获 ,信和 号 处 理 函 数 或 捕 鼠 器 就 失效 了 。 

在 早期 的 版 本 中 ,信号 处 理 函 数 在 另 一 个 方面 也 很 像 捕 鼠 器 : 在 每 次 捕获 之 后 ,都 必须 
重新 设置 它们 。 比 如 : 一 个 信号 处 理 函 数 可 能 如 下 : 


void handler(int s) 

1 
/*process is vulnerable herex / 
signal(SIGINT, handler); /xreset handlerx/ 
zn /*do work heres / 


) 


MER IER, CERE EIN IL (0 E DECR RUE S2 D RET We 
有 老鼠 渔 走 了 。 这 一 脆弱 的 间 酿 使 得 原 有 的 信号 处 理 不 可 靠 ，。 有 些 人 称 此 为 “不 可 靠 的 信 
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号 ”, 就 好 像 说 “不 可 靠 的 老鼠 "一样 ,这 倒 有 些 奇怪 了 。 

2. 设计 一 个 更 好 的 系统 

捕 鼠 器 问题 只 是 早期 信号 系统 的 一 个 弱点 。 为 了 能 说 明 问题 的 复杂 性 ,考虑 以 下 这 些 
实际 生活 中 的 问题 。 

3. 处理 多 个 信号 

真实 世界 充满 信号 ,也 就 是 意外 的 打扰 。 假 设 你 在 办 公 室 里 工作 。 电 话 可 能 会 响 ,可 能 
有 人 项 门 ,或 者 火警 响起 。 对 于 这 些 事件 ,可 以 忽略 ,也 可 以 处 理 。 处 理 一 个 电话 意味 着 放 
下 当前 的 工作 ; 拿 起 电话 ;与 打 电 话 的 人 交谈 , 挂 起 电话 ;然后 回去 做 放 在 一 边 的 工作 。 处 理 
项 门 和 这 很 相似 。 

如 果 来 访 者 在 你 接 电话 的 时 候 敲 门 会 怎样 呢 ? 你 得 放下 电话 , 按 保持 键 ,开门 ,和 来 访 
者 交谈 ,然后 回去 继续 接 电话 。 在 接 完 电话 之 后 , 回 到 办 公 桌 旁 继 续 工作 。 这 种 情况 下 ,第 
二 个 信号 打 断 了 对 第 一 个 信号 的 处 理 。 

接 下 来 ,正当 你 与 第 一 个 来 访 者 交谈 时 ,第 二 个 来 访 者 来 了 又 该 怎么 办 呢 ? 一般 情况 
下 ,第 一 个 人 会 挡住 门 ,这 样 第 二 个 人 就 得 等 你 与 第 一 个 人 交谈 完毕 。 当 你 与 第 一 个 人 交谈 
完毕 ,第 二 个 人 就 可 以 硕 门 了 。 这 种 情况 下 , 称 第 二 个 来 访 者 在 接待 第 一 个 来 访 者 结束 之 前 
被 阻塞 (blocked) 。 

还 有 ,如 果 来 访 者 来 访 的 时 候 你 正 专 注 于 电话 那 头 讲话 怎么 办 ? 当 你 从 门口 回来 重新 
拿 起 电话 ,是 继续 刚才 的 话题 还 是 告诉 对 方 你 已 经 忘记 刚刚 说 到 哪儿 了 ? 

最 后 ,如 果 在 你 处 理 火 警 的 时 候 电话 响 了 或 者 有 人 敲 门 又 该 如 何 呢 ? 如 果 一 个 像 火警 
一 样 重要 的 信号 达到 ,你 或 许 希望 阻塞 其 他 信号 。 就 像 你 在 处 理 火警 时 不 会 管 电话 铃 是 否 
响 了 ,或 者 是 否 有 人 敲 门 一 样 。 有些 时 候 就 算 你 没有 在 处 理事 件 也 不 想 被 其 他 事情 打扰 。 

4. 进程 的 多 个 信号 

进程 要 面 对 的 问题 和 你 要 面 对 的 没有 什么 太 大 不 同 。 想 象 一 个 进程 在 它 的 小 屋 ( 内 存 ) 
里 工作 。 如 图 7. 15 Bron. 用 户 可 能 通过 按 下 Ctrl-C 来 产生 一 个 SIGINT 信号 ,或 者 是 
Ctrl - V^£ SIGQUIT 信号 ,或 者 计时 器 到 时 产生 一 个 SIGQLRM 信和 号。 就 像 电话 和 敲 门 的 
访 者 ,所 有 这 些 信 号 可 能 同时 到 达 。 在 Unix 系统 里 ,一 个 进程 如 何 响应 多 个 信号 ? 






SIGINT handler 
SIGQUIT handler 
SIGALRM handler 


图 7.15 一 个 接收 到 多 个 消息 的 进程 


(1) 处 理 函 数 每 次 使 用 之 后 都 要 被 禁用 吗 ? ( 捕 鼠 器 模型 ) 
(2) 如 果 SIGY 消息 在 进程 处 理 SIGX 消息 时 ,到 达 会 发 生 什么 ? 
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(3) 如 果 进 程 还 在 处 理 前 一 个 SIGX 消息 时 ,第 二 个 SIGX 消息 又 到 来 会 发 生 什 么 ? 第 
=P RAT WE? 

(4) 如 果 消 息 到 来 时 ， 程 序 正在 处 理 getchar 或 者 read 22 ARYA T BHL SE 38 Se fn] ? 

不 同 版 本 的 Unix 的 答案 各 不 相同 。 写 一 个 在 各 个 系统 于 都 能 正常 工作 的 程序 很 不 
容易 。 


7.7.3 测试 多 个 信号 


系统 是 如 何 回答 这 些 问题 的 ? 编译 并 运行 sigdemo3. c, 看 看 你 系统 中 的 进程 是 如 何 响 
应 信号 组 合 的 : 


/* sigdemo3.c 
* purpose; show answers to signal questions 
* questionl; does the handler stay in effect after a signal arrives? 
* question2; what if a signalX arrives while handling signalX? 
* questioni: what if a signalX arrives while handling signalY*? 
x questioni, what happens to read() when a signal arrives? 
xf 


# include  «—stdio.h— 
# include «signal. h> 


# define INPUTCEN 100 





main(int ac, char * av[ D 

{ 
void inthandler(int); 
void quithandler(int); 
char input[iNPUTLEN]; 


int nchars; 

signal( SIGINT, inthandler ); /* set handler x/ 
signal( SIGQUIT, quithandler 5; /* set handler »/ 
do | 


printf("XnType a nessageXn") ; 
nchars = read(0, input, (INPUTLEN — 1)); 
if (i nchars == -1)} 
perror( "read returned an error"); 
else į 
input[nchars] = 'A0'; 
printf("You typed, * s", input); 


} 
while( strnemp( input , "quit", 4) 1= 0), 
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void inthandler(int s) 

{ 
printf(" Received signal *d.. waiting\n", s ); 
sleep(2); 
printf(" Leaving inthandler Mn"); 

} 

void quithandler(int s) 

{ 
printf(" Received signal %d.. waiting\n", s ); 
sleep(3) ; 
printf(" Leaving quithandler Mn"); 

) 


试 着 以 不 同 的 方式 常规 输入 和 两 个 信号 生成 键 Ctrl-C 和 Ctrl-\。 特 别 地 ,以 不 同 的 时 
延 , 试 试 以 下 组 合 跟踪 图 7. 16 中 显示 的 函数 的 控制 流 。 
^ YD CCCC 
(2) V CC 
(3) hello^C Return 
(4) hello Return-C 
(5) -\-\hello-C 


main loop 


“Chandler 


^Mhandler 





7.16 跟踪 这 些 函 数 的 控制 流 


这 些 试验 的 结果 显示 了 你 的 系统 是 如 何 处 理 信 号 组 合 的 。 

l. RY HHS AAS) 

如 果 两 个 SIGINTS 信和 号 杀 死 了 进程 ,那么 意味 着 你 的 系统 是 不 可 靠 的 信号 : 处理 函 数 
必须 每 次 都 重 置 。 如 果 多 个 SIGINTS 信号 没有 杀 死 进程 ,意味 着 处 理 函 数 在 被 调用 后 还 起 
作用 。 现 代 信 号 处 理 机 制 允许 你 在 两 者 之 间 做 出 选择 。 

2. SIGY 打 断 SIGX 的 处 理 函 数 ( 接 电话 的 时 候 有 人 敲 门 ) 

当 接 连 按 下 Ctrl-C 和 Ctrl-\ 会 看 到 程序 先 跳 到 inthandler ,接着 跳 到 quithandler, 然 后 
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再 回 到 inthandler; 最 后 回 到 主 循环 。 你 的 试验 结果 是 如 何 的 ? 

3. SIGX 打 断 SIGX 的 处 理 函 数 ( 两 次 高 门 ) 

这 种 情况 就 像 昌 个 人 来 敲 门 。 右 3 种 处 理 的 方法 ; 

(1) 递归 ,调用 同一 个 处 理 亲 数 衬 ; 

(2) 忽略 第 二 个 信号 ,这 和 没有 呼叫 等 待 功能 的 电话 机 类 似 ; 

(3) 阳 塞 第 二 个 信号 直到 第 一 个 处 理 完毕 。 

原来 的 信号 处 理 系 统 使 用 方法 (1), 人 允许 递归 调用 。. :个 更 安全 的 选择 是 方法 63)。 就 
REP AR) ,第 二 个 信号 被 阻塞 而 不 是 忽略 , 肯 到 第 -- 个 信号 宅 处 理 完 。 你 的 系统 阻 
塞 第 一 个 信号 吗 ? 述 是 递归 调用 处 理 函 数 ” 人 和 你 的 系统 将 多 个 信号 排队 吗 ? 

4. RP RM RRA GEREN EAA) 

ix RESET AGE. 程序 经 常 在 等 待 输 人 的 时 候 接 收 到 信 导 。 在 上 画 堵 个 测试 程序 
中 , 主 循环 阳 塞 以 等 待 键盘 的 输 和 人 (read JAF). 4a AB RC Ctrl- CORR (Ctrl -\) E 
序 跳 转 到 信号 处 理沙 数 。 当 处 理 函 数 处 理 完 成 后 ,程序 回 到 主 循环 ,应 该 回 到 跳 离 的 位 置 。 
但 果 上 真如 此 吗 ? WRA hel” ,接着 按 下 Ctrl-C ARABS A‘ lo" HEE SRE? 程 
序 看 到 的 是 完整 的 hello" zs ERA "lo"? 程序 是 重新 开始 read 还 是 从 read 返回 同时 设置 
errno 到 EINTR? 

是 重新 开始 还 是 返回 昵 ? 在 ATST BU Unix 中 是 返回 并 设置 EINTR 为 一 1( 经 典 模 
式 ) ,而 在 UCB 中 会 自动 的 重新 开始 ， 


7.7.4 信号 机 制 其 他 的 弱点 


早期 的 信号 系统 还 有 两 个 弱点 。 

d. 不 知道 信号 被 发 送 的 上 原因 ， 

信和 号 处 理 函 数 是 一 个 存 信 和 号 到 达 的 时 蛋 被 调用 的 函数 。 内 核 传 给 处 理沙 数 一 个 信号 数 
字 编 号 。 在 sigdeme3. c "Past inthandler 被 调用 时 得 到 一 个 值 为 SIGINT MRS. HAS 
编导 作为 参数 传 给 处 埋 函 数 使 一 个 函数 可 以 处 理 客 个 信号 。 比 如 ,在 sigdemo3. e 中 可 以 用 
一 个 处 理 函 数 奉 代 原 来 的 两 个 处 理 函 数 ,根据 参数 来 决定 打印 什么 。 

早期 的 模型 只 告诉 处 理 歼 数 它 被 调用 是 由 什么 类 型 的 信号 而 引起 的 ,但 是 没有 告 之 为 
FAZERES. En. JUR SER AR RS SEAR H Coating point exception)。 比 如 除 
KAS BAMA Pi. HARES ARH. 

2. 处 理 函 数 中 不 能 安全 地 阻塞 其 他 消息 

响应 一 个 火警 时 ,一 般 情况 下 会 忽略 电话 铃声 。 恨 设想 让 程序 在 啊 诬 SIGINT 时 忽略 
SIGQUIT。 使 用 经 典 信 和 号 机 制 修 改 inthandler, 如 下 所 示 : 





























void inthandler(int s) 
1 
int rv; 


void ( * prev ghandler)(); /*holds prev handlers / 





D ER AO. AHR AA RR 2E B5 38 UR dL. 
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prev ghandier = signal(STGQUIT,SIG IGN}; 
/*ignore QUITsx/ 


signal(S1GQUIT,prev ghandler); /*restore bandler= / 


1 


这 样 ERE A p Bp Ab EB o CIE 5E HGB UL ROR. IX RODA 
两 个 问题 。 第 一 在 调用 inthandler 和 调用 signal 之 疝 是 它 的 软肋 所 在 ,这 里 只 是 希望 调用 
inthandler 和 忽略 SIGQUIT 同时 进行 。 第 二 ,这 里 并 不 想 忽略 SIGQUIT ,而 只 是 想 阻塞 它 
直到 inthandler 处 理 完成 ,如 同 想 在 火警 之 后 再 回来 接 电话 。 在 处 理 完 关键 事件 后 ,还 是 很 
高 兴 看 到 SIGQUIT 回来 工作 ， 


7.8 信号 处 理 2: sigaction 


在 过 去 的 儿 年 中 ,针对 原来 的 模型 所 产生 的 问题 ,各 种 相关 组 织 开 发 出 了 一 些 不 同 的 解 
决 方案 。 这 里 将 只 学 习 POSIX 模型 和 相关 的 系统 调用 。 经 典 的 信号 系统 依旧 被 支持 ,而 且 
在 一 些 应 用 中 这 些 就 名 了 。 

7.8.1 处 理 多 个 信和 号 : sigaction 


fr POSIX 中 用 sigaction 替代 signal. SRR A. HEARS Hea AB. 
果 愿 意 ,还 能 得 到 这 个 信号 上 一 次 被 处 理 时 的 设置 。 


int sigaction(signalnumber, action, prevaction) 




















这 个 函数 的 概要 如 下 。 
sigaction 
目标 指定 - ` 个 信号 的 处 理 函 数 
3X x (t # include «signal, h7» 
BARE res =sigaction(int signum, 


const struct sigaction * action, 


struct sigaction # prevaction) ; 


参数 signum RaM S 
action 指针 ,指向 描述 操作 的 结构 
prevaction ”指针 ,指向 描述 被 苦 换 操作 的 结 移 
EB E AM 
， . 0 成 功 
a eee 
第 一 个 参数 signum 指明 想 要 处 理 的 消息 、 第 二 个 参数 action 指向 描述 如 何 响 应 信号 
的 结构 体 。 第 三 个 参数 prevaction 如 果木 是 null 的 话 , 就 是 指向 描述 被 蔡 换 的 处 理 设置 的 结 
椅 体 ， 如 果 新 的 操作 设 管 成 功 则 返 男 0, 否则 返回 --1。 
l. 定制 信号 处 理 ; struct sigaction 
在 过 去 , 面 对 信 和 号 的 处 理 只 有 简单 的 由 种 选择 : SIG_DFL .SIG_IGN 或 者 函数 处 理 。 这 
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些 选 项 在 新 的 系统 中 作为 结构 体 sigaction 的 部 分 定义 依然 提供 。 结 构 体 sigaction 定义 了 如 
何 处 理 一 个 信和 导 。 以 下 是 这 个 结构 体 的 完整 定 祥 : 


struct sigaction! 
/* gc only one of these two x/ 
void ( * sa handler)(0; /*SIC DFL,SIG IGN,or function */ 


void ( * sa sigaction)(int,siginfo t x ,void *2; /x new handler */ 


Sigset t sa mask; /* signals to block while handling */ 
int sa flags; /* enable various behaviors «/ 


L 
了 


(1) 选择 sa handler 还 是 sa. sigaction? 

首先 ,要 在 老 的 信号 处 理 方式 和 新 的 更 强大 的 信号 处 理 方式 之 间作 出 选择 。 旭 果 老 的 
处 理 方式 ( 即 SIG_DFL .SIG_IGN 或 者 处 理 函 数 ) 就 够 用 了 ,那么 可 以 设置 sa_handler 为 其 
中 之 一 。 当 热 , 如 果 指 定 为 旧 的 信 叶 处 理 方式 ,那么 只 能 得 到 信号 和 编号， 否则 ,如果 设 定 sa_ 
sigaction 为 一 个 处 理 尔 数 ,那么 那个 处 理 函 数 被 调用 的 时 候 , 不 但 可 以 得 到 信和 号 编号 而 且 可 
以 获悉 微调 用 的 原因 以 及 产后 问题 的 上 下 文 的 相关 信息 。 两 者 之 癌 的 差异 总 结 如 下 。 


使 用 间 的 处 理 机 制 : 使 用 新 的 处 理 机 制 ， 
struct sigaction action; action.sa handler - handler old; 
struct sigaction action; action. sa_sigaction = handler new; 


如 何 告诉 内 核 你 使 用 的 是 新 的 信号 处 理 方 式 ? 很 简单 ,只 需 设 置 sa_flags 的 SA_ 
SIGINFO ff. 

(2) sa flags 

MR Jc: DRE Ab FR pe ORE TU 9T ROSE B] HERR IB GS 4 SE, sa flags 是 用 一 些 位 来 控制 处 理 
函数 如 何 应 对 上 述 4 个 问题 的 。 相 关 的 细节 可 以 在 手册 上 查 色 。 下 面 是 部 分 列表 。 



































标 de $ x 
SA RESETHAND 34 REB RECIBE DE FELIS RE REO de E FR el RR 
SA, NODEFER CR 5a KAP SADR. PERRO Se 
Ed 
SA RESTART 当 系 统 调用 是 针对 一 些 慢 速 的 设备 或 类 似 的 系统 调用 ,重新 开始 ,而 
不 是 返回 。 这 样 是 采用 BSD 模式 
SA SIGINFO 指明 使 用 sa. sigaction É 4E FH ERRE, MR RAB BBS 


么 就 使 用 sa_handler fü jal EG RE GE GEO EL. HAE sa_sigaction 被 使 用 ， 
传 给 处 理 函 数 将 不 只 是 依 导 编导 ,还 包括 指向 描述 信 生 产生 的 原因 和 


条 件 的 结构 体 
OO 


(3) sa mask 
SUB REEE- HB UBER SED SEHE. se mask 中 的 位 指定 哪些 信和 号 要 被 
HÆ. GRAY sa_mask, 可 以 在 逃离 火灾 现场 时 阻塞 电话 呼叫 和 来 访 者 。sa_mask 的 值 包括 要 
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被 阻塞 的 信号 集 。 阻 塞 信号 是 防止 数据 损 筑 的 重要 技术 。 下 一 章 将 详细 介绍 这 个 主题 。 


2. 例子: 使 用 sigaction ~ 
下 面 的 例子 演示 了 如 和 何 使 用 sigaction (注意 程序 如 何 做 到 在 处 理 SIGINT 时 阻塞 


SIGQUIT 8): 


/* sigactdemo.c 


* purpose, shows use of sigaction() 

¥ feature , blocks ^ while handling “C 

* does not reset ^C handler, so two kill 
af 


# include <Ustdio. K> 
Hinclude «signal, h- 
H define INPUTLEN 100 


main() 

1 
struct sigaction newhandler; /* new settings #/ 
sigset t blocked; /* set of blocked sigs «/ 
void inthandler() ; /* the handler x/ 
char x[ ITNPUTLEN | ; 


/* load these two members first x/ 


newhandler.sa handler = inthandler; 
/* handler function «/ 


newhandler.sa flags = SA RESETHAND | SA_RESTART; 
/* options x/ 


/* then build the list of blocked signals «/ 


sigemptyset(&blocked); /* clear all bits «/ 
sigaddset(&blocked, SIGQUIT); /* add SIGQUIT to list «/ 
newhandler.sa mask = blocked; /* store blockmask »/ 
if ( sigaction(SIGINT, &newhandler, NULL) == - 1) 
perror("sigaction™) ; 
else 
while( 1 ){ 


fgets(x, INPUTLEN, stdin); 
printf( "input; % s", x); 


} 


void inthandler(int s) 


{ 
print&( "Called with signal %d\n", s}; 
sleep(s); 
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printf("done handling signai * din", s); 
} 








试 善 运 行 这 个 程序 。 如 果 以 很 抉 的 速度 连续 按 Ctrl-C 和 Ctr] -N ,退出 信号 将 被 阻塞 直 
到 中 断 信 号 处 埋 完毕 。 如 果 连 续 按 两 下 Ctrl-C ERR ORS RE, MRENE 
获 所 有 的 Ctrl-C, 将 SA_RESETHAND WTM sa flags P EHE, 


7.8.2 信号 小 结 


一 个 进程 可 能 被 各 种 米 源 的 信号 中 断 ， 信 和 叶 可 能 在 任何 时 候 以 任何 顺序 到 过 。signal 
提供 了 一 种 简单 但 是 不 完整 的 信号 处 理 机 制 。POSIX 接口 , 即 sigaction 提供 了 复杂 的 .明确 
定义 的 方法 来 控制 进程 如 何 对 各 种 信号 组 合 做 出 反应 。 

现在 已 经 知道 如 何在 程序 中 管理 时 间 和 中 断 。 视 频 游 戏 还 需要 最 后 一 项 技术 ; 防止 
HEAL » 





7.9 防止 数据 损毁 (Data Corruption) 


你 有 曾经 被 同时 做 几 件 事情 搞 得 荣 头 转向 并 因此 犯错 误 的 经 历 吗 ? 如 果 门 铃 在 你 寻找 
邮票 的 时 收 响 起 ,你 可 能 会 寄 出 一 封 没有 贴 邮票 的 和信。 程序 也 有 同样 的 阿 题 。 当 它们 正在 
处 理 一 件 事情 时 被 消 用 到 其 他 地方 .它们 就 可 能 会 被 杭 党 以 至 于 把 事情 弄 得 一 团 精 。 

来 看 看 在 现实 生活 中 中 断 是 如何 引起 数据 错误 的 。 然 后 学 习 在 程序 中 如 何 防 止 这 种 情 
BLA. 


7.9.1. 数据 损毁 的 例子 


继续 那个 办 公 室 的 例子 。 蔽 你 办 公 室 门 的 人 要 把 他 的 名 字 和 地 址 号 到 一 个 列表 里 。 每 
个 人 只 在 列表 的 最 后 添加 一 项 记录 : 姓名 、 桂 道 .城市 .省份 和 邮编 。 考 虑 以 下 两 个 问题 。 

第 一 , 当 一 个 人 正在 往 列 表 里 写 信息 时 有 人 打 电 话 来 要 列表 里 的 名 字 和 地 址 。 如 果 你 
将 列表 的 信息 读 给 人 家 ,就 会 有 给 出 不 完整 信息 的 可 能 。 这 可 以 通过 在 受 访 时 挂 掉 电 话 来 
阻止 这 类 错误 的 发 生 。 

第 二 ,考虑 一 个 不 同 的 问题 。 当 一 个 访问 者 刚刚 把 姓名 填 好 ,第 二 个 SIGKNOCK 信和 号 
到 达 。 如 果 允 许 递归 的 信号 处 理 , 第 一 个 访 者 要 等 第 二 个 访 者 填 好 他 的 信息 后 再 继续 在 列 
表 的 末尾 填 自 己 余 下 的 信息 。 这 样 列表 就 包含 了 错误 的 数据 ; -条 记录 在 另外 一 条 记录 中 
间 。 这 可 以 通过 一 个 接 一 个 而 不 是 递归 的 接待 访 者 来 防止 这 类 错误 ， 

这 两 个 例子 说 明了 在 一 些 情况 下 一 个 操作 不 应 该 被 其 他 操作 打 断 。 在 对 一 个 数据 结构 
(这 里 是 列表 ) 改 动 结束 之 前 ,其 他 函数 不 能 读 或 邱 这 个 数据 结构。 当然 ,处 理 像 火警 一 类 的 
信号 是 安全 的 ,因为 这 类 处 理 并 不 读 或 修改 数据 。 


7.9.2 WR SE [X (Critical Sections) 
一 段 收 改 一 个 数据 结构 的 代码 如 果 在 运行 时 被 打 断 将 导致 数据 的 下 完整 或 损毁 , 则 称 
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这 段 代码 为 临界 区 。 当 程序 处 理 信号 时 ， 必须 次 定 哪 一 段 代码 为 临界 区 ,然后 设法 保护 这 上段 
代码 。 临 答 区 不 一 定 就 在 信号 处 理 函 数 中 ,很 多 出 现在 常规 的 程序 流 中 。 促 护 临界 区 的 最 
简单 的 办 法 就 是 阻塞 或 忽略 那些 处 理 阔 数 将 要 使 用 或 修改 特定 数据 的 信和 号 


7.9.3 阻塞 信和 号: sigprocmask 和 sigsetops 


可 以 在 信 号 处 理 者 一 级 或 进程 一 级 阻塞 信和 号 。 

l. 在 信号 处 理 者 一 级 阻塞 情 号 

为 了 在 处 理 一 个 信号 的 时 候 阻 塞 另 一 个 信和 号 ,要 设置 struct sigaction 结构 中 的 sa, mask 
成 员 位 , 它 在 设置 处 理 丽 数 时 被 传递 给 sigaction。sa_tnask 是 sigset t 类 型 , 它 定义 了 一 个 
信号 集 。 我 们 将 简要 地 解释 这 个 集合 。 

2, 一 个 进程 的 阻塞 信和 号 

在 任何 时 候 一 个 进程 都 有 一 些 信号 被 阻塞 。 注 意 ,是 阻塞 而 不 是 忽略 。 这 个 信号 集 就 
称 为 信和 号 挡 板 (signal mask), Jt sigprocmask 可 以 仁政 这 个 被 阻塞 的 信号 集 ， 
sigprocmask 作为 一 个 原子 操作 根据 所 给 的 信号 集 来 修改 当前 被 阻塞 的 信号 集 ， 

















sigprocmask 
目标 修改 当前 的 信号 挡 板 
头 文 件 # include «signal, h> 








函数 原型 int res = sigprocmask( int how, 
: const sigset t * sigs, 


sigset t * prev); 


参数 how 如何 收 改 信和 号 挡 板 
sigs ”指向 使 用 的 信号 列表 的 指针 
prev “指向 之 前 的 信号 挡 板 列表 的 指针 (或 为 null) 
一 1 XH 
0 上 成功 








返回 值 





sigprocmask 修改 当前 的 信和 号 挡 板 设置 MP how 的 值 分 别 为 SIG. BLOCK, SIG 
UNBLOCK zi SIG. SET 时 , = sigs 所 指定 的 信号 将 被 添加 .删除 或 替换 ， 如 果 prev 不 是 
null ,那么 之 前 的 信号 挡 板 设置 将 被 复制 到 * prev 中 。 
3， 用 sigsetops 43443 $ 3E 
一 个 sigset t 是 一 个 抽象 的 信和 叶 集 ,本 以 通过 一 些 函 数 来 浴 加 或 删除 信号 。 基 本 的 函数 
AF. 


sigemptyset(sigset t * setp) 
清除 由 setp 指向 的 列表 中 的 所 有 信号 。 


sigfillset(sigset t # setp) 


添加 所 有 的 信号 到 setp 措 向 的 列表 。 


sigaddset(sigset_t x setp, int signum) 
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添加 signum 刻 setp 指向 的 列表 ， 


sigdelset(sigset t x setp, int signum) 


M. setp 指向 的 列表 中 删除 signum 所 标识 的 信号 。 


4, 例子: BNE PG 
程序 可 以 用 以 下 代码 来 暂时 地 阻 蹇 SIGINT 和 SIGQUIT fa: 


sigset t sigs,prevsigs; /* define two signal sets */ 
sigemptyset(&sigs); /* turn off all bits */ 
sigaddset(&sigs, SIGINT); /* turn on SIGINT bit «/ 
sigaddset(&sigs, SIGQUIT); /* turn on SIGQUIT bit +/ 


Sigprocmask(SIG BLOCK, &sigs, &prevsigs); /* add that to proc mask «/ 
f/f .. modify data structure bere., 


sidqproomask(SIG SET, x prewsigs, NULL); /* restore previous mask */ 


注意 这 里 是 如 何在 修改 一 个 tty 驱动 或 者 文件 描述 符 的 时 候 保存 先前 的 设置 ,然后 用 保 
存 的 设 秸 来 恢复 原来 的 信号 挡 板 。 除 非 目的 就 是 修改 获取 的 资源 , 再 则 释放 资源 时 恢复 获 
取 时 的 状态 是 个 好 习惯 。 


7.9.4 重 入 代码 (Reentrant Code): 递归 调用 的 危险 


打 断 别人 登记 ,而 将 自己 的 和 名字 和 地址 插 在 别人 的 记录 中 间 的 例子 引入 另 一 个 与 数据 
损毁 有 关 的 概念 : 可 重 入 函数 。 

一 个 信号 处 理 者 或 者 一 个 消 数 ,如 果 在 激活 状态 目 能 被 调 开 而 不 引起 任何 问题 就 称 之 
为 可 重 人 的 。 

在 通过 sigaction 设置 时 ,可 以 通过 设置 SA_NODEFER 位 来 允许 处 理 函 数 的 递归 调用 。 
反之 ,可 以 通过 清除 此 位 来 阻塞 信和 号。 如 何 选 择 呢 ? 

如 果 处 理 者 不 是 可 重 人 的 ,必须 阻塞 信 导 。 但 是 如 果 阻 塞 信号 ,就 有 可 能 持 失 信号 。 信 
号 不 像 电话 便条 那样 贴 在 那里 等 你 回 米 处 理 。 有 些 信和 叶 是 非常 重要 的 : 丢掉 一些 是 安全 
的 吗 ? 

是 丢掉 信号 还 是 弄 乱 数据 ”哪个 更 糟 些 ” 有 没有 办 法 同时 避免 这 两 个 问题 ?设计 使 用 
人 迟 和 导 的 程序 时 ,这些 是 必须 考虑 的 问题 。 信 号 处 理 上 小 的 错误 现象 不 很 有 规律 :尤其 在 系统 处 
于 高 负载 的 情况 下 或 者 在 精确 的 性 能 计量 的 时 候 。 排 铺 需 要 理解 信号 处 理 的 工作 机 理 ,还 
要 知道 哪里 可 能 会 有 问题 。 


7.9.5 视频 游戏 中 的 临界 区 


STE Loh. HE RAR RA. APR PBA. 间隔 计数 
EMR. APRN PURSE A NUS C MARL REEMN OH, BEA 
^r Fi ABE FR P A EAT ER, CS] PIC BS BHI? 在 应 用 所 有 已 学 的 
知识 来 完成 视频 游戏 之 前 , 先 来 看 看 另 -- 个 信号 的 来 源 : 其 他 进程 ， 
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7.10 kil: 从 另 一 个 进程 发 送 的 信号 


信号 来 自 间隔 计时 器 ,终端 驱动 ,内核 或 者 进程 。 一 个 进程 可 以 通过 kill 系统 调用 向 另 
一 个 进程 发 送信 号 : 


一 -~ ———————À 
kill 





目标 向 一 个 进程 发 送 一 个 信号 
头 文件 # include 一 sys/types, h> 

# include — signal. h> 
函数 原型 int kill(pid_t pid，int sig) 
参数 pid 目标 进程 id 

sig 要 被 发 送 的 信和 号 
返回 什 -1 失败 

0 成 功 





kill 向 一 个 进程 发 送 一 个 信号 。 发 送信 号 的 进程 的 用 户 ID 必须 和 目标 进程 的 用 户 ID 
相同 ,或 者 发 送信 号 的 进程 的 拥有 者 是 一 个 超级 用 户 。 一 个 进程 可 以 向 自 己 发 送信 号 。 

一 个 进程 可 以 向 其 他 进程 发 送 任何 信息 ,包括 一 般 来 自 键盘 、 间 隔 计 时 器 或 者 内 核 的 信 
号 。 比 如 一 个 进程 可 以 向 另 一 个 进程 发 送 SIGSEGV 信号 ,就 好 像 目 标 进程 执行 了 非法 内 存 
ER. 

Unix 命令 kill 使 用 kill 系统 调用 (如 图 7. 17 R). 








图 7.17 一 个 进程 使 用 kill() 来 发 送信 息 


1. 进程 间 通 信 的 含义 

接受 信号 的 进程 几乎 可 以 设置 任何 信号 的 处 理 者 。 考 虑 一 下 在 收 到 SIGINT 时 就 打印 
OUCH! 的 程序 。 如 果 其 他 进程 向 OUCH! 程序 发 送 SIGINT 又 该 如 何 呢 ? OUCH! 程序 
会 捕获 信号 , 跳 转 到 处 理 者 ,打印 OUCH! (如 图 7. 18 所 示 )。 

更 进一步 。 如 果 第 一 个 程序 设置 一 个 间隔 计时 器 ,计时 器 的 信号 处 理 函 数 向 OUCH! 
程序 发 送 SIGINT 信和 号。 这 样 相应 的 处 理 函 数 就 被 调用 。 从 而 一 个 进程 的 计时 器 控制 了 另 
一 个 进程 的 函数 调用 。 实际 上 ,一 组 进程 可 以 像 橄榄 球 运动 员 传递 橄 模 球 那样 传递 信号 ， 
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图 7.18 信号 的 复杂 用 法 


2. IPC 信号 设计 : SIGUSR1,SIGUSR2 

Unix 有 两 个 信号 可 以 被 用 户 程序 使 用 。 它 们 是 SIGUSR1 和 SIGUSR2。 这 两 个 信号 没 
有 预定 义 任务 。 可 以 使 用 它们 以 避免 使 用 已 经 有 预定 义 语 义 的 信号 。 

将 在 后 面 几 章 学 习 进 程 间 通信 。 编 程 时 可 以 有 很 多 方法 组 合 使 用 kill 和 sigaction。 


7.11 使 用 计时 器 和 信号 : 视频 游戏 
现在 回 到 视频 游戏 。 游 戏 有 两 个 主要 元 素 : 动画 和 用 户 输入 。 动 画 要 平滑 ,用 户 输入 会 
改变 运动 状态 。 下 一 个 程序 bounceld.c 让 用 户 可 以 将 字符 串 在 屏幕 上 弹 来 弹 去 。 
7.11.1 bounceld.c: 在 一 条 线 上 控制 动画 


' 首先 来 看 看 bounceld 看 上 去 是 什么 样子 。 界 面 如 图 7.19 所 示 。bounceld. c 将 一 个 单 
词 平 滑 地 在 屏幕 上 移动 。 当 用 户 按 下 空格 键 ,单词 就 向 反方 向 移动 。“s” 键 和 “f” 键 分 别 增加 
和 减少 单词 的 移动 速度 。 按 “Q” 键 退出 程序 。 






=hellof 


退出 反弹 


减速 加 速 


7.19 bounceld 的 运行 界面 : 用 户 控制 的 动画 


这 个 程序 是 如 何 实现 的 呢 ? 我 们 已 经 知道 如 何 实现 动画 。 在 一 个 地 方 画 一 个 字符 串 ， 
等 几 毫 秒 ,然后 氛 去 旧 的 影像 并 在 原来 位 置 的 左边 或 右边 一 个 单位 距离 重新 画 同 一 个 字符 
串 。 这 里 希望 控 去 和 重 画 动作 以 相同 的 间隔 连续 的 进行 。 所 以 使 用 间隔 计时 器 来 调用 相应 
的 处 理 函 数 。 

两 个 变量 分 别 记 录 移 动 的 方向 和 速度 。 设 置 方向 变量 的 值 为 十 1 和 一 1 分 别 表示 向 左 
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和 向 右 移动 。 延 时 变量 记录 间隔 计时 器 的 间隔 长 度 。 较 长 的 延 时 意味 着 较 慢 的 速度 ,反之 
则 意味 着 较 快 的 速度 。 

现在 向 程序 添加 方向 和 速度 控制 。 根 据 用 户 的 键盘 输入 修改 方向 和 速度 变量 。 程 序 的 
逻辑 如 图 7. 20 所 示 。bounceld 体现 了 两 个 重要 的 技术 : 状态 变量 和 事件 处 理 。 记 录 位 置 、 
方向 和 延 时 的 变量 定义 了 动画 的 状态 。 用 户 输入 和 计时 器 信号 是 改变 这 些 状态 的 事件 。 每 
次 计时 器 到 达 信 和 号 就 调用 改变 位 置 的 处 理 函 数 。 每 次 得 到 用 户 键盘 输入 信和 号 就 调用 改变 方 
向 和 速度 变量 的 代码 。 以 下 是 它 的 代码 。 


流 到 信号 处 理 
正常 的 控制 流 ” 函数 再 返回 ” 状态 变量 







col dir 


—, 9n tickor() 






图 7.20 用 户 输入 改变 变量 值 而 变量 值 控制 动作 


/* bounceld.c 


* purpose animation with user controlled speed and direction 
* note the handler does the animation 

* the main program reads keyboard input 

* compile cc bounceld.c set_ticker.c - 1 curses - o bounceld 
x/ 


# include <stdio.h> 
f include <curses. h> 
# include <signal. h> 


/* some global settings main and the handler use */ 


f define MESSAGE "hello" 
# define BLANK " " 


int row; /* current row x/ 


int col; /x current column x/ 


int dir; /x where we are going */ 
int main() 
{ 
int delay; /* bigger => slower «/ 


int ndelay; /* new delay x/ 
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int c; 


void move_msg(int); 


initser(); 
ermade(? ; 
noecho() ; 


clear(); 


row = 10; 
col = 0; 
dir = 1 
delay = 200; 


move(row, col); 
adcdstr( MESSAGE) » 


/* user input «/ 
/* handler for timer «/ 


/* start here «/ 


/* add 1 to row number #/ 


/* 200ms = 0.2 seconds x/ 


/* get into position x/ 


/* draw message «*/ 


signal(SIGALRM, move msg ); 


Set ticker( delay }; 


while(1} 
1 
ndelay = 0; 
c = getcht); 
if Cec == 'Q') break; 
if Ce == '')dir = -dir; 
if(c == 'f'&& delay > 2) ndelay = delay/2; 
if (c == 's!' ) ndelay = delay » 2 ; 


if ( ndelay > 0 ) 


set ticker( delay = ndelay 5); 


! 
endwint(?; 


return 0; 


void move msg(int signum) 


1 


Signal(SIGALRM, move msg); /* reset, just in case «/ 


move( row, col; 
addstr( BLANK 2; 
col 十 = dir; 
movel row, col); 
addstr( MESSAGE ); 


refresh(); 


/* 
* now handle borders 
af 


/* move to new column «/ 
/* then set cursor x/ 
/* redo message */ 


/* and show it */ 


if (dir == -1E&&col-«- 0) 
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dir = 1 $ 
else if ( dir == 1 && col + strlen(MESSAGE) >= COLS ) 
dir = - 1; 


} 


1. 递归 还 是 阻塞 : 一 个 真实 的 例子 

在 学 习 信 和 号 处 理 函 数 的 数据 损毁 时 提 到 过 重 入 函数 。bounceld 提供 了 一 个 考察 这 个 问 
题 的 真实 例子 。 开 始 时 信号 处 理 函 数 move msg 每 秒 钟 被 调用 5 次 。 按 “f” 键 来 减 小 计时 器 
延 时 以 增加 动画 速度 。 如 果 按 很 多 次 “f” 键 ,两 次 计时 器 消息 之 间 的 间隔 可 能 比 一 次 处 理 函 
数 的 执行 时 间 还 要 短 。 如 果 计 时 器 消息 在 处 理 函数 忙于 擦 去 和 重 画 字符 串 时 到 达 又 会 如 何 ? 

这 个 问题 的 分 析 留 作 习 题 。 在 这 个 程序 中 使 用 signal, 到 底 是 递归 还 是 阻塞 依赖 于 你 的 
系统 。 

2. 下 一 步 做 什么 ? 

如 何 扩展 bounceld 为 一 个 弹 球 游戏 ? 首先 ,要 用 “O” 来 替换 “hello”, 因 为 “0” 更 像 一 个 
球 。 然 后 ,要 让 球 在 左右 移动 之 外 还 可 上 下 移动 。 为 了 增加 上 下 移动 的 能 力 要 添加 状态 变 
量 。 现 在 已 经 有 col 和 row 来 记录 球 的 位 置 ,dir 来 记录 水 平移 动 方向 。 如 果 要 使 球 能 上 下 
移动 ,还 要 添加 什么 变量 呢 ? 


7.11.2 bounce2d.c: 两 维 动画 
程序 bounce2d 产生 两 维 的 动画 ,可 以 让 用 户 控制 水 平 速 度 和 垂直 速度 ,如 图 7. 21 所 示 。 






l 反弹 
退出 (尚未 实现 ) 


图 7.21 两 维 动画 


bounce2d 的 3 个 设计 部 分 与 bounceld 相同 。 
(1) 计时 器 驱动 
间隔 计时 器 被 设置 为 产生 固定 的 SIGALRMS 信号 流 。 响 应 一 个 信号 , 球 向 前 移动 


(2) 等 待 键 盘 输 入 

程序 阻塞 等 待 键盘 输入 。 根 据 用 户 按 下 的 键 的 不 同 采取 不 同 的 动作 。 

(3) 状态 变量 

变量 记录 了 球 的 速度 和 方向 。 用 户 输入 修改 的 变量 值 决定 了 小 球 的 速度 。 计 时 器 处 理 
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函数 根据 速度 和 位 置 变量 来 决定 在 何 时 何 处 画 小 球 。 

看 起 来 都 很 像 bounceld。 但 这 里 有 一 点 不 同 , 这 是 一 个 重要 的 问题 如何 让 球 斜 着 
移动 ? 

让 球 斜 着 移动 是 一 个 新 闻 题 。 在 一 维 的 程序 中 ,每 个 计时 器 信号 促使 影像 在 屏幕 上 上 移 
动 一 个 单位 。 这 样 就 很 简单 : 一 个 信和 号 .一 个 单位 。 但 是 在 两 维 的 动画 中 ,情况 就 不 这 么 简 
单 了 。 考 处 一 下 图 7. 22 所 示 的 路 径 。 这 种 情况 下 ,每 垂直 移动 一 个 单位 ,水 平移 动 3 个 单 
位 。 一 种 方法 是 在 收 到 每 个 计时 器 信和 号 时 将 影像 从 A 移动 到 3B。 当 两 个 直 前边 成 一 定 比 例 
时 ,影像 的 跳 牙 可 能 比较 大 。 比 如 当 上 比例 为 3/4 时 每 次 跳 贱 达到 5 个 单位 。 








问题 : SO OR RM A B 


动 到 单元 B? 


图 7.22 直角 边 之 比 为 1/3 的 移动 路 径 











每 次 移动 一 个 单位 看 起 来 比较 好 。 当 坦 第 边 的 比 为 1/3 的 时 候 ,影像 如 图 7. 23 那样 一 
个 单位 一 个 单位 的 移动 。 注意, 影像 每 横向 移动 3 个 单位 纵向 就 移动 一 个 单位 。 横 向 移动 的 
步 数 是 纵向 移动 步 数 的 3 倍 。 

这 样 看 起 来 像 有 两 个 计时 器 。 考 虑 只 有 一 个 计时 器 。 每 隔 两 个 时 钟 信号 影像 向 右 移 动 
-个 单位 。 每 隔 6 个 时 钟 信号 程序 将 影像 向 上 移动 一 个 单位 。 这 样 球 就 会 斜 着 移动 。 如 果 
时 钟 间 隔 单 位 分 别 为 10 和 30 的 话 , 那 么 球 移动 的 路 径 要 同 , 就 是 慢 些 。-- 个 称 序 只 有 一 个 
真实 的 间隔 计时 器 ,所 以 要 构造 两 个 自己 的 计时 器 。 这 两 个 自己 的 计时 器 是 由 真实 的 间隔 
计时 器 了 豫 动 。 这 里 采用 图 7.23 所 示 的 逻辑 来 驱动 两 维 动画 。 


为 了 模 报 对 角 线 移动 ,需要 , 

每 两 个 计时 器 信号 向 看 移动 一 个 单位 ,每 六 个 
计时 器 信号 向 上 移动 一 个 单位 。 

这 种 的 技术 项 要 两 个 计时 器 。 一 个 记录 不 平 
TE zh BS RES &.— Pico E ELA ab itat 
时 器 信和 号 数 。 














图 7.23 每 次 移动 一 个 单位 更 好 


为 了 能 同时 在 两 个 方向 移动 ,用 两 个 计数 器 来 充当 计时 器 。 就 像 系 统 的 问 归 计时 器 由 
两 部 分 组 成 一 样 ,每 个 计数 器 都 有 两 个 腐 性 ， 当 前 值 和 间隔 。 当 前 值 表示 在 下 次 重 画 之 前 还 
要 等 待 多 少 个 计时 信号 。 间 隔 指 明 两 次 移动 之 间 所 要 等 待 的 计时 信号 个 数 。 两 个 成 员 变 基 
分 别 命 名 为 ttg ttm, (ADT. 


/* bounce2d 1.0 


* bounce a character (default is 'o') around the screen 
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* defined by some parameters 

证 

* user input; s slow down x component, S. slow y component 
* f speed up x component, F, speed y component 

* Q quit 

* 

* blocks on read, but timer tick sends SIGALRM caught by ball move 
* build; cc bounce2d.c set ticker.c — lcurses - o bounce2d 
xf 

B include «curses, h> 

f include  -—signal.hrc- 


d include “bounce. hv 
struct ppball the ball; 
/** the main loop « x / 


void set up(); 


void wrap up(2; 


int main() 


{ 


int c; 

set up(); 

while ( ( c = getchar()) t= Q} 
if {e == fy) the ball.x ttm-- ; 
else if {e == 's!')the ball.x ttm * ; 
else if( c == 'F')the ball.y ttm-- ; 
else if (c == 'S' }the ball.y ttmt* ; 

} 

wrap up(); 


void set up() 
fs 
* init structure and other stuff 
x/ 
1 
void ball move(int):; 


the ball.y pos = Y INIT; 

the ball.x pos - X INIT; 

the ball.y ttg the ball.y ttm Y TTM 
the ball.x ttg = the ball.x ttm = X TTM ; 
the ball.y dir 1; 


F 
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the ball.x dir = 1; 
the ball.symbol = DFL SYMBOL ; 


initser(); 
noechot} ; 
crmode() ; 


signal( SIGINT , SIG_IGN); 
mvaddeht the ball.y pos, the_ball.x_pos, the_ball. symbol ); 
refresh(); 


signal( SIGALRM, ball move ); 
set ticker( 1000 / TICKS PER SEC); 
/* send nillisecs per tick */ 


void wrap upt} 


{ 


set ticker( 0 ); 


endwin() ; /* put back to normal «/ 


void bail move(int signum) 


í 
L 


int y cur, x cur, moved; 


signal{ SIGALRM , SIG IGN ); /* dont get caught now x/ 
y cur = the ball.y pos ; /* old spot x/ 

x cur = the ball.x pos ; 

moved = 0; 

if ( the ball. y ttm > 0 && the ball.y ttg-- == 1) 


the ball.y pos += the ball.y dir 
the ball.y ttg = the ball.y ttm 


moved = 1; 


i /* move «/ 


; /* reset «/ 


} 


if (the ball.x ttm >> 0 && the ball.x ttg-- == 1)! 
the ball.x pos += the ball x dir ; /* move «/ 
the ball.x ttg = the ball.x ttm; /* reset x/ 
moved = 1; 

} 

if ( moved }{ 


mvaddch{ y cur, x cur, BLANK ); 

mvaddch( y cur, x cur, BLANK 5; 

mvaddch( the ball.y pos, the ball.x pas, the ball. symbol ); 
bounce or lose( &the ball); 





BTE 事件 驱动 编程 : 编写 一 个 视频 游戏 


Zi? * 











movet LINES ~ 1,COLS- 12; 
refresh}; 

t 

signali SIGALRM, ball move); 


/* for unreliable systems «/ 


int bounce or lose(struct ppball * bp) 


1 


int return val = 0; 


if ( bp—-y pos == TOP RON 1 
bp->y_dir = 1; 


return val = 1; 


F 


j else if ( bp—>y pas == BOT ROW }{ 


bp--y dir = -1; 


return val = 1; 


} 


if ( hp- x pos == LEFT EDGE ) | 


bp—-x dir = 1; 
1 


return val = 


, 


| else if ( bp x pos == RIGHT EDGE | 


bp—x dir = -1; 


return val = 1; 


return return val; 


} 
头 文件 为 : 
/* bounce. h xf 


/* some settings for the game +/ 


#define BLANK t 
# define DFL_SYMBOL ror 
#define TOP_ROW 5 
#define BOT ROW 20 

# define LEFT EDGE 10 
#define — RIGHT EDGE 70 


Hdefine X INIT 10 /* etarting col x/ 
Hdefine Y INIT 10 /* starting row #/ 


f define TICKS PER SEC 50 


Hdefine X MM 5 
# define Y TTM 8 


/* affects speed «/ 
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/** the ping pong ball *«/ 
struct ppball { 
int y pos, x pos, 
y ttm, x ttm, 
y ttg, x ttg, 
y dir, x dir; 


char symbol ; 


7.11.3 完成 游戏 


剩 下 的 工作 作为 练习 留 给 读 考 。 需 要 添加 挡 板 控制 球 的 代码 ,将 球 从 挡 板 弹 回 的 代码 ， 
判断 球 是 否 已 经 飞 出 界 的 代码 等 。 

到 在 为 止 已 经 学 习 了 所 有 实现 游戏 所 需要 的 技能 。 小 心 靶 酌 代 公 的 重 入 问题 。 什 么 地 
方 的 代码 会 在 一 个 时 间 多 次 被 调用 ?” 想 直 计时 器 处 理 函 数 设 让 上 成 递归 调用 的 ,还 是 阻塞 后 
ELE ST 


7.12 输入 信号 : 异步 1/O 


本 章 的 动画 和 游戏 等 待 两 类 事件 : 计时 器 信和 叶 和 键盘 输 人 。 设 置 癌 隐 计时 器 的 处 理 函 
数 来 控制 动画 ,通过 调用 getch 阻塞 程序 以 等 待 键盘 输 人 人 。 除 了 阻塞 ,还 能 像 得 到 计时 器 信 
号 那样 通过 信 上 号 来 得 到 用 户 的 输入 贻 ? 

HUM, 程序 可 以 要 求 内 核 在 得 到 输入 时 发 送信 和 号。 这 有 点 像 要 求 邮递 员 在 投递 邮件 
时 按 门铃 。 这 样 你 就 不 用 坐 在 大 门 前 整 天 盯 着 邮件 箱 而 干 些 其 他 什么 事情 或 者 睡觉 。 任 何 
时 候 只 可 一 有 信和 到 你 就 能 知道 。 

Unix 有 了 两 个 异步 输 人 (asyncehronous inpu AZ. 一 种 方法 是 当 输 入 就 绪 时 发 送信 和 号 ， 
AP RS SA BORA RRS. UCB 中 通过 设置 文件 撕 述 块 Cfile descriptor) #9 O 
ASYNC 位 来 实现 第 一 种 方法 。 第 二 种 方法 是 POSIX 标准 , 它 调用 aio_read。 下 面 将 学 习 这 
丙种 方法 。 首先 ,来 有 在 这 人 么 做 的 想法 。 


7.12.1 使 用 异步 IO 


新 版 本 的 反弹 程序 如 图 7.24 所 示 。 需 要 两 种 信号 ， SIGIO 和 SIGALRM, 所 以 要 建立 
两 个 处 理 函 数 。SIGIO 处 理 函 数 读 人 击 键 并 根据 读 人 的 数据 采取 行动 。SIGALRM AES ES 
数 驱 动 动画 并 检测 寿 撞 。 为 简单 起 见 , 去 掉 了 速度 控制 。 


7.12.2 方法 1: (B fH O ASYNC 














使 用 O_ASYNC 需 鉴 对 原 有 的 弹 球 程序 做 4 处 改动 。 首 先 要 建立 和 设置 在 键盘 输入 时 
被 调用 的 处 理 函 数 。 其 次 ,使 用 fent 的 F_SETOWN 命令 来 告诉 内 核发 送 输入 通知 信和 号 给 
进程 。 其 他 进程 可 能 也 连接 到 键盘 ， 这 里 不 想 让 这 些 进程 发 送信 号 。 第 三 ,通过 调用 feu 





第 7 章 事件 驱动 编程 : 编写 一 个 视频 游戏 * 219 * 





col dir data 
Soo 


— on input() 
r 


— on_ alarm() 








图 7. 24 键盘 和 计时 器 都 发 送信 和 号 


来 设置 文件 描述 符 0 中 的 O_ASYNC 位 来 打开 输入 信号。 最 后 ,循环 调用 pause 等 待 来 自 计 
时 器 或 键盘 的 信号 。 当 有 一 个 从 键盘 来 的 字符 到 达 ,内 核 向 进程 发 送 SIGIO 信号 。SIGIO 
的 处 理 函 数 使 用 标准 的 curses 函数 getch 来 读 入 这 个 字符 。 当 计时 器 间隔 超时 ,内 核发 送 以 
前 已 经 处 理 的 SIGALRM 信和 号。 以 下 是 源 代码 : 


/* bounce async.c 
* purpose animation with user control, using O ASYNC on fd 


* note set ticker() sends SIGALRM, handler does animation 

* keyboard sends SIGIO, main only calls pause() 

* compile cc bounce async.c set ticker.c -1 curses - o bounce async 
x/ 


f include <stdio.h> 
# include <curses. h> 
# include <signal.h> 
# include <fcntl.h> 


/* The state of the game */ 


#define MESSAGE "hello" 


#define BLANK "o" 

int row = 10; /* current row */ 

int col = 0; /* current column «/ 
int dir = 1; /* where we are going */ 
int delay = 200; /* how long to wait */ 
intdone = 0; 

main() 


( 


void on alarm(int); /* handler for alarm x/ 
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} 


on input(int); 
enable kbd signals(); 


void 


void 


initscr(; 
crmode() ; 
neecho() ; 


clear(); 


signal(SIGIO, on input); 
enable kbd signals(); 
signal(SIGALRM, on alarm); 
set_ticker(delay) > 


move(row,col); 
addstr( MESSAGE ); 


whilet 1 done } 
pause(); 
endwin(); 


void on input(int signum? 


i 


int c = getch); 
if {e == 'Q? || e == BOF) 
done = 1; 


F 


may 


else if ( c == 


dir - - dir; 


void on alarm(int signum) 


{ 


signal(SIGALRM, on_alarm) ; 
mvaddstr( row, col, BLANK }; 
col += dir; 

mvaddstr( row, col, MESSAGE 5; 


fe 


{x 


is 
ie 


i% 


je 


/* 


js 
ja 


handler for keybd #/ 


set up screen x/ 


install a handler x; 
turn on kbd signals */ 
install alarm handler */ 
start ticking «/ 


get into position x/ 


draw initial image */ 


the main loop «/ 


grab the char */ 


reset, just in case */ 
note mvaddstr() */ 
move to new column x/ 


redo message x/ 


refreshi); /* and show it */ 
fx 
* now handle borders 
x/ 
if (dir == -1 k col <= 0) 
dir = 1; 
else if ( dir == 1 && col + strlen(MESSAGE) “>= COLS) 


dir = -1; 
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ix 
x install a handler, teil kernel who to notify on input, enable 
* signals 
x/ 
void enable kbd signals() 
{ 
int fd flags; 


fcntl(0, F SETOWN, getpid(); 


fd flags = fontl(0, F GETFL); 
fcntl(0, F_SETFL, (fd flags|O ASYNC)); 


7.12.3 方法 2: (FA aio read 


相 比 设置 文件 描述 符 的 O_ASYNC 位 ,使 用 aio read 更 加 灵活 ,当然 也 复杂 些 。 对 原来 
的 弹 球 程序 做 4 处 改动 。 

. 第 一 ,设置 销 人 被 恋人 时 所 调用 的 处 理 瑞 数 on. input, 

第 二 ,设置 struct kbebuf 中 的 变 草 来 指明 等 待 什么 类 型 的 输 人 , 当 输 入 发 生 时 产生 什么 
信和 号。 在 这 个 简单 的 程序 中 ,需要 从 文件 描述 符 0 中 读 人 ~- 个 字符 , 当 字符 被 读 人 时 希望 收 
到 SIGIO 信号 。 实 际 上 能 指定 任何 信号 , 甚 爹 是 SGARLM 或 SIGINT。 

第 三 ,通过 将 以 上 定义 的 结构 体 传 给 aio_read 来 递交 读 信 请求。 和 调用 一 般 的 read 不 
同 ,aio_read 不 会 阻 寨 进程。 相反 aio_read 会 在 完成 时 发 送信 生 。 

现在 这 个 程序 可 以 做 任何 它 想 做 的 事情 了 。 在 下 面 这 个 简单 的 例子 中 ,只 是 调用 pause 
来 等 待 信和 号 。 当 用 户 输 入 字符 ,aio_read 向 进程 发 送 SIGIO 信和 号 ,响应 处 理 函 数 被 调用 。 

景 后 ,实现 处 理 函 数 , 函 数 通 过 调用 alo return 来 得 到 输入 的 字符 。 然 后 外 理 这 个 字符 。 


/* bounce aio.c 
* purpose animation with user control, using aio read() etc 
* note set ticker() sends SIGALRM, handler does animation 
* keyboard sends SIGIO, main only calls pause(? 
* compile cc bounce aio.c set ticker.c - lrt - lourses ~o bounce aio 
x/ 
H include <Istdio. h> 
# include «curses, h> 
# include «signal. h> 


4 include aio. h> 
/* The state of the game */ 


+ define MESSAGE "hello" 
# define BLANK 


int row = 10; /* current row */ 
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int col = Q; 
int dir = 1; 
int delay = 200; 
int dene = 0; 


struct aioch kbcbuf ; 


maint} 


i 


t 


/* 
* handler called when aio read() has stuff to read 


* First check for any error codes, and if ok, then get the return code 


*/ 


void on alarm(int); 


void on input(int); 


void setup aio buffer(); 


initscr(); 
crmode() ; 
noecho(); 


clear(); 


signal(SIGIO, on input); 
setup aio buffer(); 
aio read(&khcbuf); 


signal(SIGALRM, on alarm); 
set ticker(delay); 


mvaddstr( row, col, MESSAGE ); 


while( ! done ) 
pause(); 
endwin() ; 


void on input() 


{ 


int ¢; 


char * op = 


/* check for errors «/ 


if ( aio error(Skbcbuf) |= 0) 


perror( "reading failed"); 


else 


/* get number of chars read x/ 
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/* current column */ 
/* where we are going */ 


/* how long to wait »/ 


/* an aio control buf «/ 


/* handler for alarm #/ 
/* handler for keybd «/ 


/* set up screen «/ 


/* install a handler #/ 
/* initialize aio ctrl buff x/ 


/* place a read request «/ 


/*install alarm handler «/ 
/* start ticking 


/* draw initial image */ 


/* the main loop «/ 


(char * ) kbcbuf.aio buf; /x cast to char x * / 


if ( aio return(&kbcbuf) == 1) 


i 
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c= x*cCp; 
if Cc == 'Q' || e == EOF) 
done = 1; 
else if (c == ' 1) 
dir = - dir; 


/* place a new request x/ 


aio read(&kbobuf); 


void on alarm) 

1 
signal(SIGALRM, on alarm); 
mvaddstr( row, col, BLANK 2; 
col += dir; 
mvaddstr( row, col, MESSAGE ) 


refresh(), 


; 


/* 
* now handle borders 
xf 
if (dir == -1 && col <= 0) 


dir = 1; 


/* reset, just in case x/ 
/* clear old string */ 
/* move to new column «/ 
/* draw new string */ 


/* and show it x/ 


else if ( dir == 1 && col + strlen(MESSAGE) “>= COLS) 


dir = -1; 
} 
/* 
* set members of struct, 


* First specify args like those for read(fd, buf, num) and offset 
* Then specify what to do (send signal) and what signal (SIGIO) 


xf 
void setup alio buffer() 


1 
static char input| 1]; 


/* describe what to read #/ 


/* 1 char of input «/ 


kbcbuf.aio fildes = 0; /* standard intput «/ 
kbcbuf.aio buf = input; /* buffer «/ 
kbcbuf.aio nbytes = 1; /* number to read «/ 
kbcbuf.aio offset = 4; /* offset in file */ 





/* describe what to do when read is ready x, 
kbcbuf.aio sigevent.sigev notify = SIGEV SIGNAL; 
kbcbuf.aio sigevent.sigev signo = SIGIO; /x send sIGIO «/ 
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7.12.4 ” 弹 球 程序 中 需要 异步 读 入 四 


不 。 用 户 输 和 人 阻塞 程序 ,间隔 计时 器 驱动 奈 移 避 的 模式 工作 的 很 好 ， 异 步 读 人 的 优势 
在 于 称 序 不 用 被 输入 阻塞 而 可 以 做 些 其 他 什么 。 

比如 一 个 更 有 想象 力 的 程序 可 以 用 这 段 时间 改 音 乐 .生成 声响 化 果 . 计 算 复 杂 的 背景 网 
案 :, 甚 至 于 做 -- 些 公共 服务 。 越 来 越 密 的 计算 机 贡献 出 空 亲 时间 来 帮 有 勘 计 算数 学 .大 文学 或 
医学 领域 的 一 些 大计 算 量 的 工作 。 

弹 球 程序 可 以 用 它 的 空闲 时 间 计 算 任 意 精 度 的 pi 值 .用 异步 输入 来 响应 用 户 的 键盘 输 
入 。 对 main 中 的 循环 做 以 下 收 改 ; 


改动 之 前 的 程序 ， 改动 之 后 的 程序 : 
while(! done) compute pit); 
pauset ); endwint() ; 
endwin(); 


修改 后 监督 程序 调用 函数 来 计算 pi 值 。 当 接收 划一 个 字符 ,程序 跳 至 姓 理 函数 来 处 理 
输入 ,然后 继续 计算 。 当 接收 到 一 个 计时 器 间 晤 消息 ,程序 跑 到 相应 的 处 理 陶 数 去 处 理 计时 
消息 ,处 理 结束 后 继续 计算 pi ff. 

如 这 个 程序 需要 用 新 的 方法 来 处 理 "Q” 键 被 按 下 的 消息 。 怎 样 修改 程序 来 达到 这 个 日 
的 呢 ? 


7.12.5 异步 输入 ,视频 游戏 和 操作 系统 


本 章 开 始 的 时 候 对 视频 游戏 和 操作 系统 做 了 对 比 。 本 章 的 弹 球 游戏 不 需要 异步 输入 ， 
但 操作 系统 需要 。 内 核 要 运行 程序 而 不 能 把 时 间 浪 费 在 等 竺 用户 输入 上 。 内 核 设置 当 键 
盘 . 串 口 或 网 蒜 得 到 输 人 时 被 调用 的 处 理 函数 。 内 核 从 一 个 运行 中 的 程序 跳 转 到 处 理 冰 数 ， 
处 理 输 入 ,再 跳 回 运行 中 的 程序 。 在 临界 区 ,内 核 阻 塞 信 号。 

内 核 的 异步 输入 是 由 硬件 实现 的 ,而 进程 的 异步 输入 是 由 软件 实现 的 。 它 们 之 间 有 
什么 联系 吗 ? 游戏 正在 运行 。 突 然 用 户 按 下 一 个 键 ,… 个 电子 信号 被 送 到 键盘 端口 。 刍 
盘问 启 产 生 一 个 真实 的 硬件 信号 。 这 个 信号 引发 控制 从 视频 游戏 的 运行 中 转 到 键 肯 的 设 
备 驱动 ， 

内 核 的 设备 驱动 代码 从 输入 端 品读 入 字符 ,然后 将 读 人 的 字符 通过 终端 驱动 进行 处 理 ， 
如 时 驱 动 的 文件 描述 符 被 没 置 为 异步 输入 ,内 核 向 进程 发 送信 号 。 当 进程 继续 运行 时 ,控制 
转移 到 进程 内 的 信号 处 理 范 数 。 








小 8 


1， 主 要 内 容 
* 有 些 程序 的 控制 流 很 简单 。 而 另外 一 些 则 族 响 应 外 部 的 事件 。 一 个 视频 游戏 要 响应 
时 钟 和 用 户 输 人 。 抬 作 系 统 也 要 响应 时 钟 和 外 设 。 
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* curses #4 — 440] US £8 BERE Ba SERE II AR. 
+ 一 个 进程 通过 设置 计时 器 来 安排 事件 。 每 个 进程 有 3 个 独立 的 计时 器 。 计 时 器 通过 
发 送信 号 来 通知 进程 。 每 个 计时 器 都 可 以 被 设置 为 只 发 送 一 次 信号 ,或 者 按 固 年 的 
间 足 发 送信 和 号 。 
”处 理 一 个 信号 很 简单 。 辣 时 处 理 多 个 信号 就 复杂 些 了 。 进 程 能 决定 是 忽略 信号 还 是 
阻塞 信号。 进程 能 够 告知 内 核 哪 些 信号 在 什么 时 候 阻 塞 或 忽略 。 
” 有些 隙 数 执行 一 些 复杂 的 任务 是 不 能 被 打 断 的 。 程 序 可 以 通过 小 心地 使 用 信和 号 掩 码 
来 保护 这 些 临 界 区 代码 。 
2. :进一步 的 问题 
本 章 中 ,了 解 到 视频 游戏 是 如 何 通 过 接收 和 处 理 信 号 来 同时 做 几 件 事情 的 。Unix 同时 
运行 几 个 程序 。 进程 是 如 何 运 行 的 ? 进程 来 自 何 处 ? 下 面 将 注意 力 从 操作 系统 的 基本 概念 
和 原则 转 到 如 何 创建 进程 .如 何在 进程 问 通信 这 些 细 节 上 。 
3. 习题 
7.1 pause SERE fe fei BS IA ,包括 从 键盘 生成 的 信号 ,比如 SIGINT, 
(1) 运行 sleep] 然后 按 下 Ctrl-C。 会 有 什么 现象 ? AA? 
(2) 修改 sleep] 以 处 理 SIGINT. 
(3) 再 运行 程序 , 按 下 Ctrl-C 又 会 如 何 ? 为 什么 ? 

















7.2 在 有 些 情况 下 , 慢 速 设备 (Slow Devices) ff] read 系统 调用 可 以 被 中 断 。 比 如 用 户 
可 以 通过 按 下 Ctrl-C 来 中 断 程序 从 键盘 该 入 。 而 时 一 些 情况 下 ,比如 程序 在 调 
用 read MRR AEA PRE Ctrl-C 则 不 会 中 断 系 统 调用 ， 
通过 读 手 册 或 者 查找 Web RES AR BHR IR. YHE read 的 调用 可 以 被 
中 断 ? 哪些 不 能 ?为 什么 ? 


7.3  sigprocmask 和 ISIG 另 一 种 方法 来 防止 重 人 临界 区 代码 不 被 键盘 信号 打 断 的 方 
法 是 关 掉 tty 驱动 中 的 1SIG。 这 个 方法 和 在 信 号 掩 码 上 添加 这 些 信号 有 什么 
不 同 ? 


7.4 发 明 一 种 可 重 人 的 系统 ,该 系统 支持 人 们 到 你 的 办 公 室 来 将 他 们 的 名 字 和 地址 登 
记 在 列表 中 。 试 给 出 一 种 算法 ,该 算法 中 信号 处 理 函 数 在 每 次 被 调用 时 向 一 个 文 
本 文件 的 末尾 添加 3 行 数据 。 看 看 第 5 章 有 关 文 件 自动 增长 模式 (auto-append 
mode) RIZ Hj link 来 锁 住 文件 的 练习 。 


7.5 讨论 如 果 bounceld. c 中 执行 move msg 一 次 的 时 间 比 计时 器 的 间隔 要 长 的 情况 
下 会 如 何 。 变 量 pos 会 如 何 ? 屏幕 会 有 什么 表现 ? 在 阻塞 和 递归 两 种 情况 下 回答 
这 些 间 题 。 有 没有 刀 不 丢失 信号 同时 又 防止 数据 损 般 的 方法 ? 


7.6 在 一 些 版 本 的 Unix 中 ,计时 器 信号 被 处 理 的 话 会 中 断 对 getch 的 调用 。 这 些 系统 
中 被 计时 器 信号 中 断 的 getch 会 返回 BOF。 这 对 程序 有 什么 影响 ”这 些 影响 会 产 
全 问题 吗 ?能 弥补 吗 ? 


* 226 + 








Unix/Linux 编程 实践 教程 











7. 


4. 
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异步 输入 版 的 弹 球 有 两 个 信号 处 理 两 数 。 如 果 SIGIO 在 程序 处 理 SICALRM 的 
时 候 到 达 会 如 何 ? 反之 又 如 何 呢 ? 两 个 处 理 函 数 会 相互 影响 四 ?在 处 理 信号 的 
时 候 要 阻 窜 其 他 信号 吗 ? 递归 调用 又 如 何 ? 如 果 新 的 字符 在 程序 处 理 SIGIO 时 
到 达 会 不 会 有 问题 ? 

列 出 所 有 可 能 的 组 合 ,同时 列 出 可 能 引发 的 问题 ， 


编程 练习 


.8 


. 10 


. 12 





有 些 浏览 器 支持 闪烁 字符 和 移动 字符 (theater marquee text), fg hellol. c 以 显示 
AME. MURRIPUEaOfÓ B REAR BMA RAE SS BUR 
显示 上 黑 认 的 字符 串 。 用 sleep IESEEZEJT ARR E FE 5B 2-8] (rn, 


使 用 curses 来 实现 移动 字符 效果 ,并 用 这 个 效果 显示 一 个 文件 的 内 容 。 移 动 字符 
TCR (Theater Marquee){ 或 者 传动 带 效 果 Ticker Tape) 是 在 一 个 水 平 区 域 中 水 平 
地 逐 宇 地 滚动 显示 字符 串 。 程 序 应 该 能 从 命令 行 中 读 入 文件 名 和 显示 种 的 长 度 、 
位 置 及 速度 。 


修改 helloS. c, FH usleep 来 替代 sleep ,选择 一 个 能 够 平滑 但 不 太 快 的 移动 时 间 间 
隔 值 。 

修改 程序 使 字符 串 在 屏幕 两 边 移动 变 慢 , 而 到 中 间 就 移动 加 快 。 看 看 程序 产生 
的 摇 迹 能 多 接近 单 摆 或 弹 赞 上 的 物体 的 简 谐振 动 的 轨迹 。 

想象 屏幕 的 右边 是 行星 ,字符 申 从 太空 落下 。 修 改 程序 使 之 能 模拟 重力 的 加 速 作 
用 。 可 以 做 的 更 加 真实 些 , 在 字符 串 擅 击 地 面 时 碎 列 成 四 处 飞溅 的 小 字符 。 


程序 ticker demo. c 从 信和 号 处 理 函 数 退 出 。 能 否 修改 程序 使 之 从 main 函数 退出 
而 不 是 信号 处 理 函数 。 添 加 一 个 名 为 done 的 全 局 变量 。 热 后 对 原来 的 程序 再 做 
两 处 修改 使 之 能 从 main 退出 。 两 种 方法 的 利弊 各 是 什么 ? 








IE PR sigdemo3. ce* 把 两 个 信号 处 理 函 数 台 并 成 一个。 在 合并 后 的 处 替 应 数 中 通 
过 检查 参数 来 判断 是 什么 类 型 的 信号 触发 处 理 函 数 的 调用 。 这 -改动 会 对 程序 
的 行为 有 何 影 响 ? 


你 有 连 到 远 端 机 器 ,然后 忘 了 退出 的 经 历 吗 9 一 个 后 台 运 行 的 程序 在 一 定 的 空 

闲 时 间 后 向 登 录 命令 解释 进程 发 送 SIGKILL "A f. 

(1) 写 程序 timeout. c。 这 个 程序 接受 命令 行 参数 包括 进程 ID 和 秒 数 。 程 序 睡眠 指 
定 的 秒 数 后 向 带 定 的 进程 发 送 SIGKILL 信号。 可 以 从 命令 解释 进程 用 timeout 
$$ 3600 5. 命令 来 启动 程序 。 符 号 给 表示 命令 解释 进程 的 ID, 

(2) timeout. c 的 问题 是 一 个 小 时 以 后 就 算 你 还 在 工作 它 还 是 会 让 你 退出 。 修 改 
程序 使 之 只 在 你 的 tty 没有 输入 /输出 10 4) fh DEUS ZR IB. GER: /dev/ 
ttyxx 的 修改 时 间 代 家 了 最 后 一 次 从 设备 读 人 或 写 出 数据 的 时 间 。 修 改 程序 
使 之 能 够 以 参数 的 形式 接受 uy 的 名 字 。) 
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7,14 


7, 15 


7. 16 


7.17 


在 本 练习 中 将 写 一 个 程序 在 用 户 层 模拟 图 7.14 演示 的 情况 。 说 明 如 何 由 一 个 实 
际 时 钟 驱动 两 个 不 同 的 计时 器 。 
首先 ,基于 sigdemol.c 写 一 个 名 为 ouch. c 的 程序 。 也 就 是 第 6 章 中 的 OUCH 
EF. ouch c: 将 从 命令 行 接受 两 个 参数 。 一 个 是 信和 号 处 理 函 数 要 打印 的 字符 
捉 , 另 一 个 是 信和 号 处 理 消 数 在 打印 之 前 要 被 调用 的 次 数 。 比 如 命令 : 

$ ouch hello 10 £ 
将 在 后 台 运 行程 序 ,程序 每 收 到 10 SIGINT 信号 打印 一 次 hello, 
然后 写 一 个 节拍 程序 ,并 命名 为 metronome, c。 这 个 程序 从 命令 行 接受 -一 个 进程 
IDAR. 程序 用 间隔 计时 器 来 生成 间隔 为 1 秘 的 SIGALRM 信和 导 。 处 理 函 数 利 
用 kill 系统 调用 向 指明 的 进程 发 送 SIGINT 信号。 比如 命令 : 

5 metronome 1 3456 7777 2345 
将 每 隔 1 种 钟 向 ID 为 3456.7777 和 2345 的 进程 发 送 SIGINT 信号。 
在 后 台 启 动 3 个 ouch 实例 的 进程 。 纵 每 个 进程 不 同 的 消息 字符 串 各 间 阶 。 然 后 记 下 
它们 的 ID. Jes VA 1 和 那些 进程 的 名 作为 参数 来 启动 metronome 程序 。 


用 uslecp O 3E EB. 3E EZ FF. Hj KE X8 PR CK Mb BE SAL 在 bounceld. c 中 主 律 坏 在 
getch JE PH 3E , fei Sh FE PR XE f 23 d]. ECT hello5. c 的 机 制 重 写 bounceld. 
c。 在 新 的 版 本 中 用 户 输 入 和 和 动画 的 角色 将 被 调换 ,也 就 是 说 主 循环 在 调用 
usleep 被 阻塞 ,程序 在 信和 号 处 理 函 数 中 处 理 用 户 输入 。 


写 一 个 测试 用 户 的 反应 速度 的 程序 。 程 序 等 待 一 个 随机 的 间隔 时 间 热 后 在 屏幕 
上 打印 一 个 一 位 十 进 制 数字 。 用 户 机 在 尽 可 能 短 的 时 间 内 输入 这 个 数字 。 程 序 
记录 用 户 的 反应 速度 。 程 序 进 行 10 次 这 样 的 测试 然后 报告 最 慢 、 最 快 和 平均 响 
ME. GER: 看 看 gettimeofday 的 用 户 手册 ) 


完成 本 章 开 始 描述 的 阐 球 游戏 。 泣 加 分 数 .多 用 户 、 缓 冲 器 和 其 他 任何 能 想到 的 
使 游戏 变 得 好 玩 的 机 制 。 





5. 项 目 
基于 本 章 掌 习 的 知识 ,能 够 实现 以 下 的 几 个 Unix 程序 了 : 


snake, worms 











概念 与 技巧 

Unix shell 的 功能 

Unix 的 进程 模型 

如 何 执 行 一 个 程序 

如 何 创 建 一 个 进程 

。 父 进程 和 子 进程 之 间 如 何 道 信 
相关 的 系统 调用 

* fork 


* exec 


* 


* wait 

* exit 
相关 命令 

* sh 

* ps 


8.1 进程 = 运行 中 的 程序 


Unix 是 如 和 何 运行 程序 的 ? 这 看 起 来 很 容易 ; 首先 登录 ,然后 shell 打印 提示 符 , 输 入 命 
令 并 按 回 车 键 。 程 序 立 即 就 开始 运行 了 。 当 程序 结束 后 ,sheil 打印 一 个 新 的 提示 符 。 但 这 
些 是 如 何 实现 的 呢 ? 什么 是 shell? shell 做 了 些 什么 呢 ? ABBA? 程序 是 什么 运 
行 一 个 程序 意味 着 什么 ? 

一 个 程序 是 存储 在 文件 中 的 机 器 指令 主 列 。 一 般 它 是 由 编译 器 将 源 代 码 编 译 成 二 进 制 
格式 的 代码 。 运 行 一 个 程序 意味 着 将 这 个 机 器 指令 序列 我 人 内 存 然后 让 处 理 器 (CPU) 逐 条 
执行 这 些 指令 ， 

f£ Unix 术语 中 ,一 个 可 执行 程序 是 一 个 和 机 器 指令 及 其 数据 的 序列 。 一 个 进程 是 程序 运 
行 时 的 内 存 空间 和 设置 。 图 8. 1 显示 了 程序 和 进程 。 


第 8 章 ”进程 和 程序 编写 命令 解释 器 sh * 229 。 





进程 


T 1.7 


MURR ORY AUT SRE USE! co 





图 8.1 系统 中 的 进程 和 程序 


数据 和 程序 存储 在 磁盘 文件 中 ,程序 在 进程 中 运行 。 以 下 的 几 章 里 将 学 习 进 程 概念 。 
从 命令 ps 和 sh 开始 ,然后 写 一 个 自己 的 Unix shell, 


8.2 通过 命令 ps 学 习 进程 


进程 存在 于 用 户 空间 。 用 户 空间 是 存放 运行 的 程序 和 它们 的 数据 的 一 部 分 内 存 空 间 。 
如 图 8. 2 所 示 , 可 以 通过 使 用 ps(process status 进程 状态 的 简写 ) 命 令 来 查看 用 户 空间 的 内 
容 。 这 个 命令 会 列 出 当前 的 进程 。 


用 户 空间 
容纳 进程 





文件 系统 容纳 
文件 和 目录 


图 8.2 ps 命令 列 出 当前 进程 


$ ps 

PID TTY TIME CMD 
1775 pts/1 00:00:17 bash 
1981 pts/1 00:00:00 ps 


这 里 有 两 个 进程 在 运行 : bash(shell) Ml ps 命令 。 每 个 进程 都 有 一 个 可 以 惟一 标识 它 的 
数字 ,被 称 为 进程 ID。 一 般 简 称 为 PID。 每 个 进程 都 与 一 个 终端 相连 ,这 里 是 /dev/pts/1。 
每 个 进程 都 有 一 个 已 运行 的 时 间 。 注 意 ps 对 已 运行 时 间 统 计 并 不 是 非常 的 精确 ,从 ps 只 用 
了 0 秒 就 可 以 看 出 。 à; 

ps 有 很 多 可 选项 。 和 ls 命令 一 样 ,ps 支持 -a 可 选项 ; 
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$ ps-a 

PID TTY TIME CMD 
1779 pts/d 00:00:13 gv 
1780 pts/0  00:00.07 qs 
1781 pts/O  00:00.01 vi 
2013 pts/2 00:00:23  xpaint 
2017 pts/2  00:00.02 maii 
2018 pts/1 00:00:00 ps 


-a 选 项 列 出 所 有 进程 ,包括 在 其 他 终端 由 其 他 用 户 运 行 的 程序 。 但 是 带 选 项 -a 的 输 
出 并 不 包括 shell. ps 也 有 一 个 -1 选项 来 打印 更 多 细节 : 





$ ps ~ la 

F 5 UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CHD 
000 5S 504 1773 1731 D 69 b 一 1086 do sel pts/0 00:00:13 gyr 
000 5 504 1780 1779 0 68 0 一 2309 do sel pts/0 00.00.07 qs 
000 S 504 1781 1731 0 72 a =. 1320 do sel pts/0 00:00:01 vi 
000 S 519 2013 1993 0 69 18 一 1300 do sel pts/2 00;00:23 xpain 
000 S 519 2017 1993 0 69 0 - 363 read c pts/2 00:00:02 mail 
000 R 500 2023 1755 0 79 0 一 750 一 pts/l 00:00:00 ps 


名 为 $ 的 一 列表 示 各 个 进程 的 状态 。S 列 的 值 为 R 说 明 ps 对 应 的 进程 正在 运行 。 其 他 
进程 的 S 列 值 都 是 5S, 说 明 它们 都 处 于 睡眠 状态 。 每 个 进程 都 属于 相应 的 由 UID 列 指明 的 
用 户 ID。 每 个 进程 都 下 一 个 进程 IDCPID) ,同时 也 有 一 个 父 进程 IDCPPID), 

标记 为 PRIG NI 的 列 分 别 是 进程 的 优先 级 和 niceness 级 别 。 内 核 和 根据 这 些 值 来 决定 
什么 时 候 和 运行 进程 。 一 个 进程 可 以 增加 niceness 级 别 , 这 就 像 在 超市 里 在 排队 何 账 的 时 候 
让 其 他 客户 排 到 自己 的 前 面 。 超 级 用 户 可 以 减少 他 的 niceness 级 别 , 这 就 像 排 队 的 时 候 
插队 ， 

一 个 进程 有 大 小 ,这 由 SZ 列表 示 。 这 列 的 数据 表示 这 个 进程 占用 的 内 存 大 小 ， 在 例子 
中 mail 程序 比 xpaint 占用 少 得 多 的 内 存 。 因 为 后 者 耗费 大 量 的 内 存 来 存储 影像 。 程 序 在 运 
行 的 时 候 占用 的 内 存 数量 可 能 会 动态 的 改变 。 如 果 程 序 在 运行 时 分 配 内 存 ,那么 它 占 用 的 
内 存 就 会 增加 。 

WCHAN 列 显示 进 程 睡 眠 的 原因 。 上 面 的 例子 中 所 有 睡眠 的 进程 都 是 等 待 输入 。read 
-或 do_sel 代表 内 核 的 地 址 。ADDR 和 下 已 经 不 再 用 了 ,但 是 为 了 兼容 的 原因 而 保留 它们 。 
选项 -ly 将 只 显示 目前 使 用 的 值 。 

各 个 版 本 的 Unix 间 的 可 选 命令 参数 差别 很 大 。 前 面 提 到 的 -a 和 -1 可 选项 可 能 在 你 
的 系统 中 不 能 用 或 者 结果 不 同 。 查 阅 你 的 用 户 手册 。 上 上 面 的 例子 是 来 自 于 版 本 导 为 procps 
2.0.6。 例 子 只 给 出 了 ps 的 一 部 分 显示 功能 。 

ps 命令 是 很 强大 的 。 -fa 可 选项 产生 如 下 输出 ，; 





$ ps -fa 
DID PID PPID C STIME TTY TIME CMD 
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19:53 pts/0 00:00.01 gv dinner.ps 
19:53 pts/0 00:00:07 gs - dNOPLATFONTS 
19:54 pts/0  00,00:02 vi dinner 

20:15 pts/2 00:00:00 xpaint 

20:16 pts/2 00:00:00 meil bruce 

20:36 pts/1 00:00:00 ps -af 


betsy 1779 1731 
betsy 1980 1779 
betsy 1781 1731 
yuriko 2013 1893 
yuriko 2017 1993 
bruce 2401 1755 


O è > Goao 


-于 表示 格式 化 输出 ,这样 便 于 阅读 。 用 用 户 名 代替 UID 来 显示 。 在 CMD 列 显示 完整 
的 命令 行 。 


8.2.1 系统 进程 
涂 了 用 户 运行 的 进程 外 ,其 他 一 些 是 Unix 系统 用 来 完成 系统 任务 的 进程 


$ ps -ax | head - 25 
PID TTY STAT TIME COMMAND 








1? S 0:05 init 
29 SW 3:54 [kflushd | i 
37 SR 0:38 [kupdate | 
4? su 0:00 [kpiod] 
53 SW 2;13 [kswapd | 
35 7 SW 0.00 [uhci - control] 
36 ? SW 0:00 [khubd | 
420 ? 5 0:25 syslogd 
423 7 S 0:36 klogd ~ k /boot/System. map- 2.2.14 
4377 SW 0:00 [inetdj 
449 ? S 0-02 amd ~ f /ete/am. d/conf 
461 7 SW 0:00 [ rpciod] 
466 7 5 0:00 cron 
471 ? 5 0:00 atd 
476 ¢ 8 0:00 sendmail: accepting connections on port 25 
484 4 SW 0.00 [rpc. rstatd] 
500 9 S 0:46 sshd 
504 ? SW 0,00 [ caiserver | 
506 > SW 0:00 [keyserver] 
512 7 SW 0.00 [portsentry] 
514 ? SH 0:00 [portsentry | 
561 ttyl SW 0:00 [getty] 
562 tty2 SW 0:00 [getty] 
563 tty3 SW 0:00 [getty 
3 ps -as|wc -1 
82 


二 面 的 例子 显示 了 当前 系统 中 运行 的 82 个 进程 中 的 前 24 个 。 其 中 部 分 是 系统 进程 。 
系统 进程 中 的 很 大 一 部 分 是 没有 终端 与 之 相连 的 。 它 们 在 系统 启动 时 启动 ,而 不 是 由 用 户 
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在 命令 行 输入 。 这 些 系统 进程 做 些 什么 呢 ? 

列表 中 开始 的 几 个 分 别处 于 内 存 的 不 同 部 分 ,包括 内 核 缓冲 和 虚 存 页 面 。 列 表 中 的 其 
他 一 些 管 理 系统 日 志 (klogd,syslogd) ,调度 批 任务 (cron,atd) 、 防 范 可 能 的 攻击 (portsentry) 
和 让 一 般 的 用 户 登录 (sshd,getty)。 可 以 通过 ps 一 ax 的 输出 和 Unix 手册 了 解 很 多 系统 的 
情况 。 运 行 ps 就 像 透 过 显微镜 看 一 滴 池 塘 水 。 能 看 到 很 多 各 式 各 样 的 进程 运行 在 系统 中 。 


8.2.2 进程 管理 和 文件 管理 


从 运行 ps 的 结果 看 出 进程 有 很 多 属性 。 每 个 进程 属于 某 个 用 户 ID、 有 一 定 的 大 小 、 一 
个 起 始 时 间 .已 运行 的 时 间 、 优 先 级 和 niceness 级 别 。 有 些 进 程 与 某 个 终端 相连 ,而 其 他 一 些 
则 没有 。 这 些 属性 存放 在 什么 地 方 呢 ? 曾 对 文件 提 过 同样 的 问题 。 内 核 管理 内 存 中 的 进程 
和 磁盘 上 的 文件 。 这 些 管理 活动 有 什么 相似 之 处 吗 ? 

文件 包含 数据 ,进程 包含 可 执行 代码 。 文 件 有 一 些 属性 ,进程 也 有 一 些 属性 。 内 核 建立 
和 销毁 文件 ,进程 类 似 。 就 像 管理 磁盘 的 多 个 文件 ,内 核 管理 内 存 中 的 多 个 进程 ,为 它们 分 
配 空间 ,并 记录 内 存 分 配 情 况 。 内 存 管理 和 磁盘 管理 有 什么 相似 之 处 ? 


8.2.3 内 存 和 程序 


进程 这 个 概念 有 些 抽象 ,但 是 它 代表 了 一 些 非 常 实际 的 实体 : 内 存 中 的 一 些 字 节 。 图 
8.3 演示 了 计算 机 内 存 的 3 种 模式 。 


内 存 可 以 看 作 是 一 个 容纳 内 核 
和 进程 的 空间 。 

很 多 系统 把 内 存 看 作 由 页 面 构 
成 的 数组 ,将 进程 分 割 到 不 同 
的 页 面 。 物理 上 ,这 些 页 面 可 
能 被 存放 在 固体 的 芯片 中 。 





Aw ”进程 tp 
: DA 


\ 


8.3 计算 机 内 存 的 3 种 模式 





Unix 系统 中 的 内 存 分 为 系统 空间 和 用 户 空间 。 进 程 存在 于 用 户 空间 。 内 存 实际 上 就 是 
一 个 字 节 序列 ,或 者 一 个 很 大 的 数组 。 如 果 机 器 有 64 MB 的 内 存 ; 那 意味 着 这 个 数组 有 大 约 
6700 万 个 内 存 位 置 。 其 中 的 一 些 用 来 存放 组 成 内 核 的 机 器 指令 和 数据 。 

还 有 一 些 存放 组 成 进程 的 机 器 指令 和 数据 。 一 个 进程 不 一 定 必须 要 占 一 段 连续 的 内 
存 。 就 像 文 件 在 磁盘 上 被 分 成 小 块 ,进程 在 内 存 也 被 分 成 小 块 。 同 样 和 文件 有 记录 分 配 了 
的 磁盘 块 的 列表 相似 ,进程 也 有 保存 分 配 到 的 内 存 页 面 (memory pages) 的 数据 结构 。 因 此 ， 
将 进程 表示 为 用 户 空间 内 的 一 个 小 方块 只 是 某 种 程度 的 抽象 。 

将 内 存 表示 为 连续 的 字 节 数 组 也 是 一 种 抽象 。 现 在 的 内 存 一 般 情况 下 是 由 小 电路 板 上 
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的 一 些 芯 片 组 成 。 

建立 一 个 进程 有 点 像 建 立 一 个 磁盘 文件 。 内 核 要 找到 一 些 用 来 存放 程序 指令 和 数据 的 
空 亲 内 存 页 。 内 核 还 要 建立 数据 结构 米 存放 相应 的 内 存 分 配 情况 和 进程 腐 性。 

使 可 作 系 统 变 得 神奇 的 不 仅 是 它 的 文件 系统 把 一 堆 旋 转圈 盘 上 连续 的 馈 变 成 有 序 组 
织 的 树 状 目录 结构 ,而 和 且 以 相似 的 机 制 , 它 的 进程 系统 将 硅 片 上 的 一 些 位 组 织 成 一 个 进程 
社会 一 一 成 长 、 相 互 影响 AE HE TEREC. RAR RMR, 

为 了 理解 进程 ,下 面 将 学 习 和 实现 一 个 Unix shell. shell 是 一 个 管理 和 运行 程序 的 
程序 。 


8.3 shell: 进程 控制 和 程序 控制 的 一 个 工具 


shell 是 一 个 管理 进程 和 运行 程序 的 程序 。 就 像 存 在 很 多 编程 语言 ,Unix 系统 有 很 多 种 
可 用 的 shell, 每 种 都 有 各 自 的 风格 和 优势 。 所 有 常用 的 shell 都 有 三 个 主要 功能 ， 

OD 运行 程序 

(2) 管理 输入 和 输出 

(3) 可 编程 

看 看 下 面 的 命令 序列 . 


5 grep lp /etc/passwd 
lp:x:d:7;lp:/var/spool/lpd: 
S TZ- PSTBPDT;export TZ;date;TZ = ESTSEDT 
Sat Jul 28 02:10:05 PDT 2001 
$ date 

Sat Jul 2B 05:10:14 EPT 2001 
$ ls -1 /etc > etc. listing 
$ BAMB- lp 

$ if grep 5 NAME /etc/ passwd 
> then 

=> echo hello | mail $ NAME 
mfi 
1p:x;4;7;lp:/var/spool/lpd. 
$ 


(OD 运行 程序 

grep.date.!s.echo 和 mail 都 是 一 些 普通 的 程序 ,用 CC 编写 ;并 被 编译 成 机 器 语言 。shell 
将 它们 载 人 人 内存 并 运行 它们 。 很 多 人 把 shell 着 成 是 一 个 程序 岂 动 器 (program launcher). 

(2) 管理 输入 和 输出 

shell 不 仅仅 是 运行 程序 。 使 用 二 .> 和 | 符 导 可 以 将 输入 .输出 重 定 向 。 这 样 就 可 以 告 
Vt shell 将 进程 的 输入 和 输出 连接 到 一 个 文件 或 是 其 他 的 进程 。 

(3) 编程 
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shell 同时 也 是 带 有 变量 和 流程 控制 的 编程 语言 。 在 上 面 的 例子 中 ,可 以 看 到 使 用 了 两 
个 变量 。 首 先 ,变量 TZ 被 设置 成 表示 美国 西海 岸 时 区 的 字符 串 。 然后 这 个 值 被 作为 参数 传 
给 date 命令 来 打印 当前 的 日 期 和 时 间 。 

例子 的 后 面部 分 ,可 以 看 到 有 if.. then 语句 。 变 量 NAME 被 置 为 字符 串 “1lp”。 
$ NAME 的 值 在 grep 命令 中 被 使 用 。grep 的 结果 由 让 语句 进行 判断 。 如 果 在 文件 /etc/ 
passwd 中 搜索 到 字符 串 “lp”, shell 就 执行 命令 echo hello| mail $ NAME。 否 则 跳 至 下 一 条 
命令 。 

在 本 章 中 , 先 来 看 看 shell 是 如 何 运行 一 个 程序 的 。 在 后 面 的 章节 中 将 学 习 shell 的 脚本 
语言 和 输入 、 输 出 的 重 定向 。 


8.4 shell 是 如 何 运行 程序 的 


shell 打印 提示 符 ,输入 命令 ,shell 就 运行 这 个 命令 ,然后 shell 再 次 打印 提示 符 一 一 如 此 
反复 。 那么 这 些 现象 的 背后 到 底 发 生 些 什么 ? 

一 个 shell 的 主 循环 执行 下 面 的 4 步 ( 如 图 8. 4 RAR): 

(1) 用 户 键入 a. out; 

(2) shell 建立 一 个 新 的 进程 来 运行 这 个 程序 ; 

(3) shell 将 程序 从 磁盘 载 人 ; 

(4) 程序 在 它 的 进程 中 运行 直到 结束 。 


shell 





图 8.4 用 户 要 求 shell 运行 一 个 程序 


8.4.1 shell 的 主 循环 
shell 由 下 面 的 循环 组 成 : 


while( ! end of input) 
get command 
execute command 
wait for command to finish 


考虑 下 面 这 个 与 shell 典型 的 互动 : 
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s ls 

Chap. bak Story08. tr chap08. ps chap08. tr outline. 08 
Makefile chap0a chap08.short code pix 

$ ps 

PID TTY TIME CMD 


29182  pts/5 00:00.00 bash 
29183  pts/5  00;00:00 ps 
$ 


用 图 8. 5 的 时 间 轴 来 表示 事件 发 生 次 序 。 其 中 时 间 从 左 向 右 消逝 。shell 由 标识 为 sh 


的 方块 代表 , 它 随 着 时 间 的 流逝 从 左 到 右 移 动 。shell 从 用 户 读 入 字符 申 “ls”。shell 建立 一 
个 新 的 进程 ,然后 在 那个 进程 中 运行 ls 程序 并 等 待 那 个 进程 结束 。 


a » 
RAMS RAMS 
FEH 等 待 退 出 
mp- qpr 
i 
二 -一 | is pow »-— € L— — t 
运行 命令 。 退出 B, gu 
Is "ps" 


图 8.5 shell 主 循环 的 时 间 轴 


然后 shell 读 人 新 的 一 行 输 和 人 ,建立 -- 个 新 进程 ,在 这 个 进程 中 运行 程序 并 等 待 这 个 进程 
结束 。 

当 shell 检测 到 输入 结束 , 它 就 退出 。 

ATES -个 shell, BESS, 

OD 运行 一 个 程序 ; 

(2) 建立 一 个 进程 ; 

(3) 等 待 exil()。 

当 学 会 这 些 , 就 能 用 这 些 技术 来 实现 自己 的 shel T. 


8.4.2 问题 1: 一 个 程序 如 何 运行 另 一 个 程序 


AX. 程序 调用 execvp, 

图 8.6 显示 了 一 个 程序 如 和 何 运行 另 -- 个 程序 ， 比 如 ,为 了 运行 ls -la, 一 个 程序 调用 
execvp( "Is",arglist), XE arglist 是 命令 行 的 字符 串 数组 。 内 核 从 磁盘 将 程序 载 人 内 存 ， 
命令 参数 ls 和 -la 被 传 给 程序 ,然后 程序 开始 运行 。 简 而 言 之 : 
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Unix 如 何 运 行 一 个 程序 : 


execvp (progname, arglist) 


1. 将 指定 的 程序 复制 到 调用 
它 的 进程 

2. 将 指定 的 字符 串 数组 作为 
argv[] 传 给 这 个 程序 

- 运行 这 个 程序 


w 





图 8.6 execvp 将 程序 复制 到 内 存 后 运行 它 


(1) 程序 调用 execvp 

(2) 内 核 从 磁盘 将 程序 载 人 
(3) 内 核 将 arglist 复制 到 进程 
(4) 内 核 调 用 main(arge, argv) 
下 面 是 运行 ls -1 的 完整 程序 : 


/* execl.c — shows how easy it is for a program to runa program 
*/ 


main() 


{ 
1 


char * arglist[3]; 


arglist[0] = "ls"; 
arglist{1] = "-1"; 
arglist[2] = 0; 
printf("*** About to exec ls - 1\n"); 
execvp( "ls" , arglist ); > 
printf("*** ls is done. bye\n"); 

} 


execvp 有 两 个 参数 : 要 运行 的 程序 名 和 那个 程序 的 命令 行 参数 数组 。 当 程序 运行 时 命 
令 行 参数 以 argv[] 传 给 程序 。 注 意 ,将 数组 的 第 一 个 元 素 置 为 程序 的 名 称 。 还 要 注意 ,最 后 
一 个 元 素 必须 是 null, i 

编译 并 运行 这 个 程序 ， 


$ cc execl.c - o execl 


$ ./execl.c 


*** About to exec ls - 1 
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total 28 

drwxr-x—-- 2 bruce users 1024 Jul 14 21-02 a 
drwxr-x-—- 3 bruce users 1024 Jul 16 03:16 c 
-rw-r--r-- 1 bruce users DO Jul 14 21;03 y 
$ 


| 第 二 条 打印 的 消息 哪里 去 了 ? 
再 看 一 下 代码 。 程 序 实 布 它 要 运行 ls 程序 ,运行 ls 程序 ,然后 宣布 ls 运行 结束 。 那 么 
第 二 条 信息 昵 ? 

… 个 程序 在 一 个 进程 中 运行 一 也 就 是 一 些 内 存 和 内 核 中 相应 的 数据 结构 。 这样， 
execvp 将 程序 从 磁盘 载 人 进程 以 便 它 可 以 被 运行 。 但 是 载 人 到 哪个 进程 呢 ” 这 就 是 问题 之 
所 在 , 内 核 将 新 程序 载 人 到 当前 进程 ,替代 当前 进程 的 代码 和 数据 。 

2. execvp 3E 18 4 gà 

AAP HES AOR A. UG ER E RE Rk [a] E. ER Fi PER LOS 
的 脑子 做 其 他 的 事情 。 一 种 实现 这 个 感 望 的 方法 是 拿 掉 你 的 太 脑 ,然后 装 上 爱 因 斯 坦 的 大 
脑 。 这 样 你 就 拥有 了 爱 因 斯 坦 的 思想 和 分 析 能 力 。 这 样 想 拥 有 两 个 思维 的 愿望 就 和 原来 的 
Ki? BRET. 

exec I SE UR HH OM" SAE He SEM PLE HE D BERI RE ES HARE TRA 
时 指定 的 程序 代码 ,最 后 运行 这 个 新 的 程序 。sxee 调整 进程 的 内 存 分 配 使 之 适应 新 的 程序 
对 内 存 的 有 要求 。 相 同 的 进程 ,不 同 的 内 容 。 

execvpO (A280 Fo 





























execvp 
目标 o Oooo 在 指定 路 径 中 查找 并 执行 -- 个 文件 
AAH # include « unistd, h> 
PE E result = cxeevp(const char * file, const char * argv( 1) 
i 参数 file 要 执行 的 文件 名 
argv 字符 串 数 组 
38 [el fi —1 如 果 出 错 


exeevp RAH file 指定 的 程序 到 当前 进程 ,然后 试图 运行 它 。execvb 将 以 NULL 结尾 
的 字符 串 列 表 传 给 程序 。，execvp 在 环境 变量 PATH 所 指定 的 路 径 中 查找 file 文件 。 

如 果 执 行 成 功 ,execvp 汕 有 返回 值 ， 当 前 程序 从 进程 中 清除 ,新 的 程序 在 当前 进程 中 
运行 ， 

3. A ERES shell 

前 面 所 学 已 经 足够 写 第 一 个 版 本 的 shell 了 。 这 里 已 经 知道 如 何 运 行 一 个 程序 ,还 知道 
如 何 将 命令 行 参数 传 给 它 。 第 一 个 shell 提示 用 户 输入 程序 名 和 参数 ,然后 运行 指定 的 程序 。 


Re 





D ARARA X gutter SERERE f 
V exeevp 是 … 组 基于 execve 系统 谢 册 函数 中 的 … 个 .它们 统称 为 exec。 
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将 程序 命名 为 pshl, ec, 它 是 带 提 示 符 的 shell( prompting shell) 的 缩写 ， 


/* prompting shell version 1 
* Prompts for the command and its arguments. 
* Builds the arqument vector for the call to execvp. 
+ Uses execvyp(), and never returns. 


s/f 


# include <istdio. h> 
# include <(signal. hi> 
# include «string. h> 


d define MAXARGS 20 /* cmdline arga*/ 

# define ARGLEN 100 /* token lengthe/ 

int main() 

{ 
char + arglist[ MAXARGS + 1]; /* an array of ptrsx/ 
int numargs; /* index into array«/ 
char argbuf[ ARGLEN] ; /* rend stuff herex/ 
char * makestring() ; /* malloc etc «/ 


numargs = 0; 
while ( numargs < MAXARGS } 
{ 
printf("Arg| * d]? ", numargs); 
if ( fgets(argbuf, ARGLEN, stdin) && + argbuf t= Mn' ) 
arglist[numargs ++ | = makestring(argbuf); 


else 
{ 
if ( numargs “> 0 )1 /* any args? #/ 
arglist[numargs ! = NULL; /* close list +/ 
execute( arglist 2; /* do itx/ 
numargs = 0; /* and reset «/ 
} 
} 
} 
return 0; 


! 


int execute( char * arglist[ !) 
/* 
* use execvp to do it 
x/ 
1 
execvp(arglist[0 , arglist); /* do it«/ 


perror("execvp failed"); 
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exit(1); 


1 
D 


char + makestring( char * buf ) 
fx 

* trim off newline and create storage for the string 
af 

{ 


char * cp, * malloc); 


buffstrlen(buf)— 1] = 'X0'; /* trim newline «/ 
cp = malloc( strlen(buf) +13; /* get memory x/ 
if (cp == NULL | ` /* or die «/ 
fprintf(stderr, "no memory\n") ; 
exit(1); 
1 
stropy(cp, buf); /* copy chars x/ 


return cp, /* return ptr «/ 


i 


psht. c 是 Unix shell 的 第 一 个 单 案 。pshl 要 求 每 个 字符 申 单独 的 输 和 ,第 一 个 是 程序 





名 ,然后 依次 是 程序 参数 。 代 码 包 括 两 步 : (1) 一 个 字符 申 


个 字符 串 的 构造 参数 列表 


arglist, 最 后 在 数组 末尾 加 上 NULL; (2) 将 arglist[0] 和 arglist 数组 传 给 execvp, 如 图 8. 7 

















所 示 。 
1. 将 命令 行 读 人 缓冲 . 
2 将 缓冲 分 割 为 参数 列表 。 
RAPS ROM REE oxccep-. 
. 图 8.7 用 数组 构造 afglist 

编译 并 运行 程序 : 

$ cc pshl.c - o pshi 

$ ./pshl 

Arg[0]? 1s 


Arg[1'? -1 
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Arg[2]? demodir 

Arg[ 3]? 

total 2 

drwxr-x--- 2 bruce users 1024 Jul 14 21:02 a 
drwxr-x--- 3 bruce users 1024 Jul 16 03:16 c 
-fW-r--r-- 1 bruce users 0 Jul 14 21:03 y 
$ 


4 它 怎 么 退出 了 ? 
程序 运行 正常 ,但 是 就 像 设 想 的 那样 ,execvp 用 命令 指定 的 程序 代码 覆盖 了 shell 的 程 
序 代码 ,然后 在 命令 指定 的 程序 结束 之 后 退出 。 这 样 shell 就 不 能 再 次 接受 新 的 命令 。 为 了 
运行 新 的 命令 ,用 户 不 得 不 再 次 运行 shell。 
shell 如 何 能 做 到 在 运行 程序 的 同时 还 能 等 待 下 一 个 命令 呢 ? 方法 之 一 就 是 启动 一 个 新 
的 进程 ,由 这 个 进程 来 执行 命令 程序 。 


8.4.3 问题 2: 如 何 建立 新 的 进程 
答案 : 一 个 进程 调用 fork 来 复制 自己 。 


用 法 : fork(); /*takes no argumentsx/ 

1. 解释 fork 

继续 用 爱 因 斯 坦 大 脑 思考 的 问题 做 比喻 。 就 像 先前 看 到 的 ,将 爱 因 斯 坦 的 大 脑 放 到 你 
的 脑壳 里 不 但 把 爱 因 斯 坦 的 思想 给 了 你 ,同时 也 清除 了 所 有 你 原来 大 脑 里 的 思想 。 

解决 的 方法 之 一 就 是 复制 一 个 自己 ,采用 三 位 影像 复制 技术 ,逐个 原子 的 复制 一 个 完全 
等 价 的 自己 。 当 你 建立 了 自己 的 复制 品 ,将 爱 因 斯 坦 的 大 脑 放 到 它 的 脑壳 里 ,这 样 你 就 可 以 
继续 你 原来 的 计划 和 思考 了 。 在 你 生命 中 的 某 个 阶段 ,世界 上 只 有 一 个 你 。 当 你 按 下 复制 
机 的 复制 按钮 ,世界 上 有 了 两 个 你 。 对 自己 的 复制 有 点 像 马 路 上 的 岔口 。 开 始 只 有 一 条 路 ， 
然后 有 了 两 条 。 

fork 之 前 fork 之 后 

父 进程 子 进程 








新 的 进程 拥有 和 父 进程 相同 的 
代码 和 数据 


图 8.8 fork() 复 制 一 个 进程 
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这 就 是 系统 调用 fork (RAST. 8.8 显示 了 fork 调用 前 后 的 系统 状况 。 进 程 拥 有 程 
序 和 当前 运行 到 的 位 置 。 进 程 调用 fork, 当 控制 转移 到 内 核 中 的 fork 代码 后 ,内 核 做 : 

(OD 分 配 新 的 内 存 块 和 内 核 数据 结构 

(2) 复制 原来 的 进程 到 新 的 进程 

(3) 向 运行 进程 集 添 加 新 的 进程 

(40 将 控制 返回 给 两 个 进程 

当 你 按 下 复制 机 的 开始 按 锂 后 , 扯 界 上 将 有 两 个 你 ,物理 上 ,心理 上 都 是 相间 的 。 但 是 
每 个 人 将 开始 你 (他 7) 自己 的 人 生 之 路 。 类 似 地 , 当 一 个 进程 调用 fork 之 后 ,就 有 两 个 二 进 制 
代码 相同 的 进 释 。 而 且 它 们 都 运行 到 相同 的 地 方 。 但 是 每 个 进程 都 将 可 以 开始 它们 自己 的 
旅程 。 看 如 下 程序 。 

2. 合子; forkdemol.c 建立 一 小 新 的 进程 

forkdemol. c 有 了 两 句 打 印 语 各, 一句 在 fork 之 前 ,一 句 在 fork 之 后 : 





/* forkdemol.c 
* shows how fork creates two processes, distinguishable 


* by the different return values from fork() 
x/ 


# include  «stdio.h7 


maini) 
{ 
int ret_from_fork, mypid; 
/* who am i? x/ 


mypid = getpid{); 
/* tell the world */ 


printf("Before:; my pid is * d\n", mypid); 
ret from fork = fork(); 
sleep(1); 
printf ("After; my pid is %d, fork() said Ss d\n", 
l getpid(), ret from fork); 
} 


如 果 这 是 一 个 普通 的 程序 ,将 看 刘 两 行 输出 ,每 行 打印 一 个 状态 。 但 是 当 它 运行 时 将 
看 到 ， 


$ ec forkdemol.c - o forkdemol 

$ . /forkdemnol 

Before;my pid is 4170 

After;my pid is 4170,fork() said 4171 
$ After, my pid is 4171,fork( said 0 


”这 里 可 以 看 到 三 行 输出 ,一 行 Before: 信息 和 两 行 After: 信息 。 进 程 4170 先是 打印 
Before: 消息 ,然后 它 又 打印 After: 消 息 一 一 一 切 正常 。 另 一 个 After: 信息 是 由 进程 4171 
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打印 的 。 注 意 进程 4171 没 有 打印 Before: 信息 。 为 什么 呢 ? 用 户 空间 的 近 照 (如 图 8. 9 所 
示 ) 显 示 了 进程 4170 调用 fork 前 后 发 生 了 什么 。 


fork 之 前 fork 之 后 





一 个 控制 流 进入 内 核 的 fork 模块 调用 完成 时 ， 从 fork 返回 两 个 控制 流 
图 8.9 子 进 程 执行 fork() 之 后 的 代码 


内 核 通 过 复制 进程 4170 来 创建 进程 4171, 它 将 4170 的 代码 和 当前 运行 到 的 位 置 都 复 
制 给 4171。 其 中 当前 运行 的 位 置 是 由 随 着 代码 向 下 移动 的 箭头 表示 的 。 新 的 进程 4171 从 
fork 返回 的 地 方 开始 运行 ,而 不 是 从 开头 开始 运行 。 因 为 4171 是 从 中 间 开 始 运行 的 ,也 就 不 
打印 Before: 信息 了 。 

3. 例子: forkdemo2. c 子 进 程 创 建 进 程 

子 进程 不 是 从 main 函数 的 开始 ,而 是 从 fork 返回 的 地 方 开始 它 的 生命 之 旅 。 预 测 一 下 





下 面 程序 会 有 几 行 输出 : 
/* forkdemo2.c 一 shows how child processes pick up at the return 
x from fork() and can execute any code they like, 
* even fork(). Predict number of lines of output. 
x/ 
main() 


{ 
printf("my pid is % d\n", getpid() ); 
fork(); 
fork(); 
fork(); 
printf("my pid is % d\n", getpid() ); 
} 


编译 并 运行 这 个 程序 ,结果 如 何 ? 
4. 例子 : forkdemo3. c 分 辨 父 进程 和 子 进程 





从 forkdemol. c 可 以 看 到 进程 4170 调用 fork 创立 子 进程 , 子 进程 PID 是 4171。 两 个 进 
程 有 相同 的 代码 ,运行 到 同一 行 有 相同 的 数据 和 进程 属性 。 那 么 如 何 才能 分 辨 到 底 是 父 进 
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程 还 是 子 进程 呢 ? 

这 两 个 进程 不 是 完全 相同 的 。 从 forkdemol. c 的 输出 可 以 看 出 ,不 同 的 进程 ,fork 的 返 
回 值 是 不 同 的 。 在 子 进 程 中 fork 返回 0, 在 父 进 程 中 fork xx [B 4171, d 36 fork 的 返回 值 进 
程 可 以 很 容易 的 判断 自己 是 子 进 程 还 是 父 进程 。 

在 下 一 个 例子 forkdemo3. c 中 ,进程 根据 fork 返回 值 的 不 同 打印 不 同 的 消息 : 


/* forkdemo3.c - shows how the return value from fork() 


* allows a process to determine whether 
* it is a child or process 
xf 


d include «stdio. hc 


main) 
1 


int fork rv; 
printf("Before: my pid is $ din", getpid()); 
fork rv = fork(); /* create new process «/ 


if ¢ fork rv == -1) /* check for error x/ 


perror("fork'"),. ` 


else if ( fork rv == 0} 
printf("I am the child. my pid = % dn", getpid()); 
else 
printf("I am the parent, my child is & d\n", fork rw); 
} 


于 面 是 运行 结果 : 


$ .fforkdemo3 ` 
Before: my pid is 5931 

Iam the parent. my child is 5932 

I am the child. my pid = 5832 

$ 


fork 小 结 如 下 。 

系统 调用 fork 正 是 解决 shell 只 能 运行 -条 命令 这 个 问题 所 需要 的 。 使 用 fork ,不 但 能 
够 创建 新 的 进程 ,而 且 能 够 分 辨 原来 的 进 称 和 新 创建 的 进程 。 新 的 进程 能 调用 execvp 来 执 
行 任 何 几 户 指明 的 程序 . 

这 里 明确 建立 一 个 shell 所 需 一 项 技术 中 的 两 项 。 知 道 了 如 何 建立 进程 (fork) 和 和 如何 运 
行 一 个 程序 (execvp) 。 最 后 需要 知道 如 何 让 父 进 程 等 鞋子 进程 结束 。 
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fork 
目标 创建 进程 
AM # include<< unistd, h> 
西数 原型 pid t result = fork(void) E 
$8 没有 
iE E —1 如 朵 错误 


0 返回 刹 子 进程 
pid 将 子 进 程 的 进程 iD 传 给 父 进程 





8.4.4 问题 3: 父 进程 如 何等 待 子 进程 的 退出 


SE. 进程 调用 wait 等 待 子 进程 结束 。 

用 法 ; pid 二 wait( &status); 

1. KẸ waitO 

系统 调用 weit 做 两 件 事 。 首 先 , wait 暂停 调用 它 的 进程 直到 子 进程 结束 。 然 后 ,wait 取 
得 子 进程 结束 时 传 给 exit 的 值 。 | 

BH 8. 10 显示 了 wait 是 如 何 工作 的 。 注 意 时 季 轴 是 自 左 向 右 的 , 父 进 程 在 左边 开始 调用 
fork。 肉 核 构造 子 进 程 , 这 里 子 进 程 由 另外 一 个 小 方块 代表 。 子 进程 开始 和 父 进程 并 行 运 
行 , 父 进程 调用 wat, 内 核 挂 起 父 进 程 直 到 子 进程 结束 。 父 进程 标识 为 wait 的 一 段 暂停 


运行 。 
fork ( ) wait ( ) 
| |- 一 一 ~ 了 一 全 | 一 一 一 一 一 ——— 


图 8.10 wat 暂停 父 进程 直到 子 进程 结束 


最 终 子 进程 会 结束 任务 并 调用 exit(n)。n 是 0 到 255 的 一 个 数字 。 

当 子 进程 调用 exit ,内 核 唤醒 父 进 程 同 时 将 子 进 程 传 给 exit 的 参数 。 噶 醒 和 传递 退出 
Cexit} 值 的 动作 由 从 exit 的 括号 到 父 进程 的 箭头 表示 。 这 样 wait 执行 两 个 操作 : 通知 和 
通信 。 

2. SIT: waitdemol. ec 一 一 通知 

waitdemol. c 显示 了 子 进程 调用 cxit EWP AE wait 返回 父 进程 的 。 


/* waitdemol.c — shows how parent pauses until child finishes 


ui 
H include <stdio.h> 


#define DELAY 2 





第 8 章 进程 和 程序 : 编写 命令 解释 器 sh . * 245 * 





maint ) 
i 
int newpid; 
void child code(), parent code(); 


printf("before; mypid is * d\n", getpid()); 


if ( (newpid = fork(}} == +1) 
perror("fork"),; 
else if ( newpid == 0) 
child code(DELAY), 
eise 
parent code(newpid); 
} 
{* 
* new process takes a nap and then exits 
xf 
void child_codet int delay) 
{ 
printf( "child *d here. will sleep for $d seconds\n", getpid(), delay); 
sleep(delay) ; 
printf( "child done. about to exit\n") ; 
exit(17); 
} 
/* 
* parent waits for child then prints a message 
«/ 
void parent code(int childpid) 
1 
int wait rv; /* return value from wait() »/ 
wait rv = wait(NULL}; 
printf("done waiting for &d. Wait returned; 5 din", childpid, wait rv); 


运行 waitdemo1, c 的 结果 如 下 : 


$ . /waitdemol 

before; mypid is 10328 

child 10329 here. will sleep for 2 seconds 
child done. about to exit 

do waiting for 10329. Wait returned;10329 


运行 程序 .调整 时 间 , 可 以 发 现 父 进程 总 会 等 到 子 进程 调用 exit, 图 8.11 演示 了 控制 流 


和 两 个 进程 之 间 的 数据 传输 。 在 父 进程 ,控制 流 始 于 程序 的 开始 ,在 wait HE. EF 
进程 ,控制 流 始 于 main 函数 的 中 部 ,然后 运行 child code 函数 ;最 后 调用 exit 结束 。 子 进程 
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调用 exit 就 像 发 送 一 个 信号 给 父 进 程 以 唤醒 它 。 


父 进程 在 wait 处 阻塞 ， | child code() ... : 

然后 在 子 进程 退出 后 继 Wo. | £o c bien nti 

续 运 行 。 Vr Y ^» 57 I EANA Yaba dot zr 
exit(n); 2 


z (ozone boss erga 
/ ced ü 


int status; 





图 8.11 调用 wait() 前 后 的 控制 流 和 进程 间 通 信 


waitdemol. c 程序 体现 了 wait 的 两 个 重要 特征 ， 

(1) wait 阻塞 调用 它 的 程序 直到 子 进程 结束 

在 这 个 简单 的 程序 中 , 父 进程 阻塞 直到 子 进 程 调用 exit, 这 一 特征 使 两 个 进程 能 够 同步 
它们 的 行为 。 比 如 , 父 进 程 用 fork 创建 一 个 子 进程 来 对 一 个 文件 排序 。 父 进程 必须 等 排序 
.结束 后 才能 继续 处 理 这 个 文件 。 系 统 调用 exit 和 wait 是 - -种 协调 这 些 任务 的 方法 。 

(2) wait 返回 结束 进程 的 PID 

在 这 个 简单 的 程序 中 ,wait 的 返回 值 是 调用 exit 的 子 进程 的 PID. 就 像 在 forkdemo2. c 
中 看 到 的 ,一 个 进程 可 以 创建 多 个 子 进程 。 考虑 一 个 从 两 个 不 同 的 远程 数据 库 整合 数据 的 
程序 。 这 个 程序 可 以 使 用 fork 来 创建 两 个 进程 ,一 个 用 来 连接 并 从 数据 库 中 提取 数据 , 另 一 
个 从 其 他 数据 库 提取 数据 ，。 从 第 一 个 数据 库 提 取 来 的 数据 需要 做 些 后 期 处 理 , 而 从 第 二 个 
数据 库 提取 来 的 数据 则 不 需要 这 样 的 处 理 。 

wait 的 返回 值 告诉 父 进程 那个 任务 结束 了 。 这 样 它 就 可 以 继续 有 效 的 处 理 了 。 

3. 例子 : waitdemo2. c- 通信 

wait 的 目的 之 一 是 通知 父 进程 子 进程 结束 运行 了 。 它 的 第 二 个 目的 是 告诉 父 进 程 子 进 
程 是 如 何 结束 的 。 

一 个 进程 以 3 种 方式 (成 功 、 失 败 或 死亡 ) 之 一 结束 。 其 一 ,一 个 进程 可 能 顺利 完成 它 的 
任务 。 按照 Unix 惯例 ,成 功 的 程序 调用 exit(0) 或 者 从 main 函数 中 return 0, 

其 二 ,进程 可 能 失败 。 比如 进程 可 能 由 于 内 存 耗 尽 而 提前 退出 程序 。 按 Unix 惯例 , 程 
序 遇 到 问题 而 要 退出 调用 exit 时 传 给 它 一 个 非 零 的 值 。 程序 员 可 以 对 不 同 的 错误 分 配 不 同 
的 值 ,手册 中 有 详细 的 描述 。 
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最 后 ,程序 可 能 被 一 个 信号 杀 死 ( 见 第 6 和 第 7 章 )。 信 号 可 能 来 自 键盘 .间隔 计 时 器 、 内 
核 或 者 其 他 进程 。 通 常 的 情况 下 ,一 个 既 没 有 被 忽略 又 没有 被 捕获 信号 会 杀 死 进程 的 。 

wait 返回 结束 的 子 进程 的 PID 给 父 进 程 。 父 进程 如 何 知 道子 进程 是 以 何 种 方式 退出 
的 呢 ? 

答案 在 传 给 wat 的 参数 之 中 。 父 进程 调用 wait 时 传 一 个 整 型 变量 地 址 给 函数 。 内 核 
将 子 进程 的 退出 状态 保存 在 这 个 变量 中 。 如 果子 进程 调用 exit 退出 ,那么 内 核 把 exit 的 返 
回 值 存放 到 这 个 整数 变量 中 ; 如 果 进 程 是 被 杀 死 的 ,那么 内 核 将 信号 序号 存放 在 这 个 变量 
中 。 这 个 整数 由 3 部 分 组 成 一 一 8 个 bit 是 记录 退出 值 ,7 个 bit 是 记录 信号 序号 , 另 一 个 bit 
用 来 指明 发 生 错误 并 产生 了 内 核 映 像 (core dump), Hl 8. 12 演示 了 子 进程 状态 值 的 3 个 
部 分 。 


exit value af sienna 


core dump flag ...^ 





8.12. 子 进程 状态 值 有 3 部 分 
例子 waitdemo2. c 是 基于 waitdemol. c 的 , 它 显示 了 子 进程 的 退出 状态 ; 


/* waitdemo2.c — shows how parent gets child status 
x/ 


# include <stdio.h> 
+#define DELAY 5 


main() 
{ 
int newpid; 
void child code(), parent code(); 


printf("before; mypid is * din", getpid()); 


if ( (newpid = fork()) == -1) 
perror("fork") ; 


else if ( newpid == 0 ) 
child _code(DELAY) ; 


else 
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parent_code(newpid) ; 
} 
fs 
* new process takes a nap and then exits 
x/ 
void child code(int delay) 
1 
printf("child $d here. wil] sleep for &d seconds\n", getpid(), delay); 
sleep(delay) ; 
printf("child done. about to exit\n"); 
exit(l7); 
} 
* parent waite for child then prints a message 
xf 
void parent code(int childpid) 
1 
int wait rv; /* return value from wait() x/ 
int child status; 
int high B, low 7, bit 7; 


wait rv = wait(&child status); 
printf("done waiting for +d, Wait returned. & d\n", childpid, wait rv); 


high 8 = child status D> 8; /* 4111 1111 0000 0090 */ 
iow 7 - child status & Ox7F; /* 0000 0000 0111 1111 x/ 
bit 7.2 child status & 0x80; /* 0000 0000 1000 0000 xy 


printf("status; exit = &d, sig- $d, core- $n", high 8, low 7, bit 7); 


首先 ,让 waitdemo2 正常 退出 。 退 出 状态 从 子 进 程 处 复制 ， 


& ./waitdemo2 

before, mypid is 10855 

child 10856 here. will sleep for 5 seconds 
child done. about to exit 

done waiting for 10856 . Wait returned; 10856 


Status; exit = 17, sig - 0, core=0 


然后 ,在 后 台 运 行 waitdemo2 ,使 用 kill( 见 第 ? 章 ? 来 向 子 进程 发 送 SIGTERM 信和 号， 


5 ./waitdemo2 & 

.$ before: mypid is 10857 

child 10858 here. will sleep for 5 seconds 
kill 10858 
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$ done waiting for 10858, Wait returned; 10858 


status; exit- 0, sig=15, core- 0 .- 























waitC) 小结 如 下 。 
wait 
目标 等 待 进程 结束 
头 文件 # include «sys/types, h> 
| # include < sys/wait. h> 
函数 原型 pid t result = wait(int * statusptr) 
参数 statusptr 于 进程 的 运行 结果 
返回 值 一 1 RR 
pid 结束 进程 的 进程 计 
EAB waitpid(2), wait3(2) —— 


wait 系统 函数 挂 起 调用 它 的 进程 直到 得 到 这 个 进程 的 子 进 程 的 一 个 结束 状态 。 结 束 状 
态 是 退出 值 或 者 是 信号 序号 。 如 果 有 -一 个 子 进程 已 经 退出 或 被 杀 死 ,对 wait 的 调用 立即 返 
回 。wait 返回 结束 进程 的 PID。 如 果 statusptr 不 是 NULL, wait 将 退出 状态 或 者 信和 号 序号 
复制 到 statusptr 指向 的 整数 中 。 这 个 值 可 以 用 和 sysywait. h> PARAM 

如 果 调 用 的 进程 没有 子 进 程 也 没有 得 到 终止 状态 值 , 赐 wait 返回 一 1。 


8.4.5 小结; shell 如 何 运 行程 序 


这 一 节 以 问题 shell 是 如 何 运 行程 序 的 ?" 开 始 , 现 在 已 经 知道 答案 了 :， shell 用 fork 建 
立新 进程 ,用 exec 在 新 进程 中 运行 用 户 指定 的 程序 ,最 后 shel 用 wait 等 待 新 进程 结束 。 
wait 系统 调用 同时 从 内 核 取得 退出 状态 或 者 信 导 序号 以 告知 子 进程 是 如 何 结 束 的 。 | 

每 个 Unix shell 都 是 使 用 图 8. 13 所 未 的 模型 。 现 在 将 这 3 个 系统 调用 组 合 在 一 起 实现 
一 个 真正 的 shell。 


" 进程 
oe} (aa fe fone 
. | | [| exec 上 -| main [---+| exit 


4. 运行 新 5 新 程序 。 “56. 新 程序 结束 
程序 在 运行 











fl 8.13 shell 的 forkQ) 、exec() 和 wait B PK 
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8.5 实现 一 个 shell: psh2.c 


图 8. 14 是 一 个 Unix shell 的 简化 流程 图 。 下 一 个 shell psh2.c 将 使 用 这 个 流程 。 


— get command 


pa 

| | 

| 三 一 fork 一 一 < 

| wait n 
| 

| | | 

| ER exit 


图 8.14 Unix shell 的 基本 逻辑 


/* * prompting shell version 2 
eX 
** Solves the 'one- shot! problem of version 1 05 ID 
xx Uses execvp(), but fork()s first so that the 
x shell waits around to perform another command 
x * New problem; shell catches signals. Run vi, press ^c. 


xx/ 


# include <stdio.h> 
d include «signal. h> 


H define MAXARGS 20 /* cmdline args «/ 
# define ARGLEN 100 /* token length x/ 
maint} 
{ 
char — * arglist| MAMARGS +1]; /* an array of ptrs */ 
int numargs; /* index into array */ 
char  argbuf[ARGLEN]; /* read stuff here +, 
char  * makestring(); /* malloc etc x/ 


numarqs = 0; 
While ( numargs < MAMARGS ) 
{ 
printf("Arg| & d]? ", numargs}; 


if ( fgets(argbuf, ARGLEN, stdin) && x argbuf |= ny) 
arglist[numargs ++ | = nakestring(argbuf); 
else 


1 


if ( numargs > 0 31 /* any args? x/ 
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arglist[numargs]- NULL; /# close list #/ 
execute( arglist ); /* do it x/ 


numargs = 0; /* and reset x/ 


} 


return 0; 


} 


execute( char * arglist[ | } 


fs 
+ use fork and execvp and wait to do it 
af 
{ 
int pid, exitstatus; /* af child #/ 
pid 7 fork(); /* make new process */ 


switch( pid ){ 

case — l: 
perror("fork failed™}; 
exit(1); 

case 0; 
execvp(arglist[0], arglist); /* do it «/ 
perror("execvp failed"); 
exit(15; 

default: 
while( wait(&exitstatus) I= pid) 
printf ("child exited with status 4d, & din", 

exitstatus >8, exitstatus&0377) ; 


} 
char « makestring( char * buf } 


fe 

* trim off newline and create storage for the string 
x/ 

1 


char *cp, *malloc(); 


buf[strlentbuf)- 1] = 'AQ'; /* trim newline «/ 
cp = malloc( strlen(buf) +1); /* get memory x/ 
if { ep == NULL )| /* or die x/ 


fprintf(stderr, "no memory\n") + 
exit(li; 
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strcpy(cp, buf); /* copy chars */ 


return cp; /* return ptr */ 


测试 一 下 psh ,看 看 它 是 否 解决 了 只 能 运行 一 条 命令 这 个 问题 ， 


$ ./psh2 

Arg[0]? la 

Argli]? -1 

Arg[2]? demodir 

Arg[3]? 

total 2 

drwxr—x--— 2 bruce users 1024 Jui 14 21 :02 a 
drwxr-x---— 3 bruce users 1024 Jul 16 03:16 c 

-rw-r--r-- tf bruce users Q Jul 14 21:03 y 
child exited with status 0,0 

Arg[0]? ps 

Arg (1)? 

PID TTY TIME CMD 

11616 pts/4 00:00:00 bash 
. 11648 pts/4 00:00:00 psh2 

11664 pts/4 00:00:00 ps 

child exited with status 0,0 

Arg[0]? pshi WE! 能 运行 pshl T 


Arg[1]* 

Arg[0]? ps RÆ psh 的 提示 符 ! 
Arg[ 112 

PID TTY TIME CMD 
11616 pts/4 09:00:00 bash 
11648 pts/4 00:00:00 psh2 
11683 pts/4 00:00:00 ps 


child exited with status 0,0 
Arg[0]? grep 

Arg[|1]? fred 

Arg| 2]? /etc/passwd 

Arg[ 37? 

child exited with status 1,0 
Arg[0]? 接生 

Arg[0 |? Arg[ 0]? Arg[ 0]? exit 
Arg[ 17? 

execvp failed; No such file or directory 
chiid exited with status 1,0 
Arg[0]? Wc 

$ 
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如 何 做 到 ? 

psh2.c 工 作 正 常 。 新 的 shell 接受 程序 名 称 、 参 数列 表 、 运 行程 序 、 报 告 结果 ,然后 再 重 
新 接受 和 运行 其 他 程序 。psh2. c 缺少 常用 的 shell 的 一 些 修饰 性 功能 ,但 可 以 作为 一 个 坚实 
的 基础 开始 了 。 

下 一 个 版 本 中 将 做 如 下 改进 : 

COD 让 用 户 可 以 通过 按 下 Ctrl-DD 或 者 输入 “exit” 退 出 程序 ; 

(2) 让 用 户 能 够 在 一 行 中 输入 所 有 参数 。 

在 下 一 章 实现 的 版 本 中 加 上 这 些 功 能 。 在 那个 版 本 中 ,将 加 上 一 些 变 量 和 控制 流程 使 
它 更 像 一 个 编程 语言 。 

这 之 前 必须 更 正 一 个 严重 的 错误 。 


信号 和 psh2. c 


从 测试 中 可 以 看 到 ,退出 程序 psh2 的 惟一 方法 是 按 Ctrl-C it. 如 果 在 psh2 等 待 子 进 
程 结束 时 键入 Ctrl-C 键 会 如 何 呢 ? 比如 ， 


$ ./psh2 
Arg[0]? tr 
Arg[1]? [a-z] 
Arg[2]? [A- Z] 
Arg[ 3]? 

hello 

HELLO 

now to press 
NOW TO PRESS 
Ctrl-C 按 下 ^C 
$ 


了 于 进程 结束 ,但 是 shell 也 结束 了 。 按 下 Ctrl - C 所 生成 的 SIGINT 信和 号 不 但 杀 死 了 运 
行 tr 的 进程 ,而 且 杀 死 了 运行 psh2 的 进程 。 为 什么 呢 ? 

键盘 信号 发 给 所 有 连接 的 进程 

程序 psh2 和 tr 都 连接 到 终端 (如 图 8. 15 所 示 ) 。 当 按 下 中 断 键 ,ttr 驱动 告诉 内 核 向 所 





图 8. 15 “键盘 信号 发 向 所 有 连接 的 进程 








. 254 . Unix/Linux 编程 实践 教程 


有 由 这 个 终端 控制 的 进程 发 送 SIGINT 信号 。tr 死 了 ,在 我 们 的 程序 里 , psh 也 死 掉 了 ,即使 


它 还 在 等 待 子 进程 的 结束 。 
如 何 才能 让 shell 不 被 用 户 按 下 的 中 断 或 退出 键 杀 死 ? 这 个 改动 留 作 习题 。 


8.6 思考 : 用 进程 编程 


为 了 理解 Unix 进程 ,运行 了 ps 命令 ,还 学 习 了 shell 如 何 使 用 fork, exit 和 wait 来 控制 
进程 和 运行 程序 。 
在 继续 学 习 下 一 章 有 关 在 shell 中 增加 变量 和 循环 之 前 ,考虑 一 下 函数 和 进程 之 间 的 相 
似 性 。 

l. execvp/exit 就 像 call/return 

(1) call/return 

—^r C 程序 由 很 多 函数 组 成 。 一 个 函数 可 以 调用 另 一 个 函数 ,同时 传 给 它 一 些 参数 。 
被 调用 的 函数 执行 一 定 的 操作 ,然后 返回 一 个 值 。 每 个 函数 都 有 它 的 局 部 变量 ,不 同 的 函数 
通过 call/return 系统 进行 通信 。 

这 种 通过 参数 和 返回 值 在 拥有 私有 数据 的 函数 间 通 信 的 模式 是 结构 化 程序 设计 的 基 
fii. Unix 鼓励 将 这 种 应 用 于 程序 之 内 的 模式 扩展 到 程序 之 间 。 这 种 模式 可 以 用 图 8. 16 来 
表示 。 





图 8.16 函数 调用 和 程序 调用 


(2) exec/exit 

一 个 C 程 序 可 以 fork/exec 另 一 个 程序 ,并 传 给 它 一些 参 数 。 这 个 被 调用 的 程序 执行 一 
定 的 操作 ,然后 通过 exit(n) 来 返回 值 。 调 用 它 的 进程 可 以 通过 wait(&result) 来 获取 exit 的 
返回 值 。 子 程序 的 exit 返回 值 可 以 在 result 的 8 一 15 位 之 间 找 到 。 

函数 调用 所 用 到 的 堆栈 几乎 是 没有 限制 的 。 一 个 被 调用 的 程序 还 可 以 调用 其 他 程序 ， 
一 个 通过 fork/exec 调用 起 来 的 程序 可 以 通过 fork/exec 调用 别 的 程序 。Unix 使 创建 一 个 
新 进程 方便 而 且 快 捷 。 用 fork/exit 和 exit/wait 来 调用 程序 和 返回 结果 不 仅 适用 于 shell， 
Unix 程序 经 常 被 设计 成 一 组 子 程序 ,而 不 是 一 个 带 有 很 多 函数 的 大 程序 。 
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由 exec 传递 的 参数 必须 是 字符 串 。 由 于 进程 间 通 信 的 参数 类 型 为 字符 串 ,这样 就 强迫 
了 子 程序 的 通信 也 必须 使 用 文本 作为 参数 类 型 。 几 乎 是 偶然 的 ,这 种 基于 六 本 的 程序 接口 
支持 跨 平 台 的 交互 ,而 这 一 点 非常 重 权 。 

2. 全 局 变量 和 fork/exec 

全 局 变量 是 有 害 的 , 它 破坏 了 封装 原则 ,导致 出 人 意料 的 副作用 了 和 难以 维护 的 代码 。 
但 有 时 相去 掉 全 局 变量 却 更 精 粮 。 怎 么 才能 做 到 不 将 参数 变 得 复杂 的 情况 下 管理 一 堆 每 个 
人 都 要 用 到 的 变量 ?尤其 是 必须 将 它们 向 下 传 几 层 的 时 候 , 情 况 会 更 加 麻烦 。 

Unix 提供 方法 来 建立 全 局 变量 。 环 境 (environment) 是 一 些 传 递 给 进程 的 字符 串 型 变 
六 集合 。 不 会 有 副作用 ， EH fork/exec RI exit/wait 机 制 是 一 一 个 有 用 的 补充 。 下 一 章 将 看 到 
它 如 何 王 作 和 如何 使 用 它 ， 


8.7 exit 和 exec 的 其 他 细节 


这 一 章 主 要 学 习 进 程 fork, execvp 和 wait, 介 是 还 需要 再 多 了 解 一 些 关 于 exit 和 exec 
的 细节 。 


8.7.1 进程 死亡 exit 和 exit 


exit 是 fork 的 道 操作 ,进程 通过 调用 exit 来 停止 运行 ， fork 创建 一 个 进程 ,exit MR dt 
H. BALE. 
exit 刷新 所 有 的 流 , 调 用 由 atexit 和 on_exit 注册 的 函数 ,执行 当前 系统 定义 的 其 他 与 
exit 相关 的 操作 。 然 后 调用 _exit。 系 统 函 数 _exit 是 一 个 内 核 操作 ,这 个 操作 处 理 所 有 分 配 
给 这 个 进程 的 内 存 , 关 闭 所 有 这 个 进程 打开 的 文件 ,释放 所 有 内 核 用 来 管理 和 维护 这 个 进程 
的 数据 结构 。 
TARE in exit 的 参数 被 如 何 姓 理 了 ?那个 进程 的 弥留 之 言 被 存放 在 内 核 直 到 这 个 进 
程 的 父 进程 通过 wait 系统 调用 取 回 这 个 值 。 如 果 父 进程 没有 在 等 这 个 值 ,那么 它 特 被 保存 
在 内 核 真 到 父 进 程 调用 wait, 那 时 内 核 将 通告 这 个 父 进程 子 进程 的 结束 ,并 转达 子 进程 的 弥 
BH. 
那些 已 经 死 了 -但 是 还 没有 给 exit 赋值 的 进程 被 称 之 为 幽灵 (zombie) 进 程 。 很 多 比较 新 
的 版 本 的 ps 列 出 这 些 进程 并 标记 为 defunct。 
_exitO MAE TF. 
系统 调用 _exit 终止 当前 进程 并 执行 所 有 必须 的 清理 工作 。 这 些 工作 在 各 个 不 同 版 本 的 
Unix 中 有 些 不 同 , 但 都 包 帮 以 下 一 些 操作 : 
OD 关闭 所 有 文件 描述 符 和 目录 拱 述 符 。 
(2) 将 该 进程 的 PID BH init 进程 的 PID. 
(3) 如 果 父 进程 调用 wait 或 waitpid 来 等 待 子 进程 结束 , 则 通知 父 进程 。 
C4) 向 父 进 程 发 送 SIGCHLD, 











Q 有些 人 认为 件 局 变量 会 学 到 错误 和 谍 乱 。 
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exit 





























目标 终止 当前 进程 
sx & include «unistd. h> 
# include —sidlib, h> 
画 数 原型 void exit(int status) 
! 参数 “statas 返回 值 
38 [B] f& kn 
相关 内 容 atexit(3) ,exit(3),on_exit(3} 


iX FE MERE PRS BR IRA CF ERE RIM SRW ULT E 
们 将 是 init 进程 的 “子女 ”, 这 有 点 像 孤 儿 由 国家 监护 。 注 意 ,就 算 父 进程 没有 调用 wait, A 
也 会 向 它 发 送 SIGCHLD 消息 。 尽 管 对 SIGCHLD 消息 的 默认 处 理 方法 是 忽略 的 。 如 果 想 
响应 这 个 消息 ,可 以 设置 一 个 处 理 函 数 。 


8.7.2 exec 家 族 


在 已 经 实现 的 shell 中 和 例 程 中 用 execvp 来 演示 进程 是 如 何 运行 -个 程序 的 。execvp 
不 是 一 个 系统 调用 , 它 是 一 个 库 函 数 ,这 个 疯 数 通过 系统 调用 execve 来 调用 内 核 服务 ， 
execve HAY e 代表 环境 (environment) ,所 以 将 推 姑 到 下 一 章 来 讨论 它 。 

还 有 一 些 调用 execve 的 函数 也 是 有 用 的 。 下 面 是 这 个 家 族 中 的 一 些 成 员 : 








^ execlp(file,argvO, argvl,..., NULL) 


execlp AR execvp 那样 用 一 个 参数 数组 。 相 反 , 传 给 main 的 argv[] 中 包括 的 参数 被 简 
单 的 放 在 execlp 的 参数 中 。 例 如 : 


execlp("ls","ls","— a", "demodir", NULL); 


以 指定 的 参数 运行 程序 1s。 当 预 先知 道 要 运行 的 命令 和 它 的 参数 时 execlp 是 有 用 的 。 
但 是 在 shell 中 ,这 个 函数 没什么 用 ,因为 在 用 户 输入 命令 之 前 不 知道 有 多 少 参 数 。 


execlifullpath,argvO,arqvl,... , NULL) ; 


execlp 和 excevp 中 的 p 代表 略 径 Cpathy。 这 两 个 函数 在 环境 变量 PATH 中 列 出 的 路 
径 中 查找 由 第 一 个 参数 指定 的 程序 。 如 果 准 确 知道 这 个 文件 的 位 置 ,那么 就 能 够 在 execl 中 
的 第 一 参数 中 指定 它 的 完整 路 径 。 例 如 ， 


execlt"/bin/ls","ls"," — a", "demodir",NULL); 


F 


以 指定 的 参数 来 运行 程序 /bin/ls。 指 定 程序 的 准确 位 置 比 运行 execip 更 快 。 因 为 后 者 
要 在 路 径 中 查找 指定 程序 。 指 定 准确 路 径 也 比 execlp 安全 。 RARER HA Piz BE 
列表 ,那么 可 能 运行 错误 的 程序 。 


execv(fullpath,arglist) 
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除了 不 在 PATH 中 查找 程序 文件 外 ,exeev 和 execvp 非常 相似 。 第 一 个 参数 必须 是 要 
执行 程序 的 完整 路 径 。 使 用 execv 或 exec! 来 执行 明确 指定 的 程序 比 依 赖 安全 的 踏 径 列表 


PATH 


2, 


更 安全 。 因 为 PATH 很 容易 被 恶意 的 用 户 臭 改 。 


小 结 


.主要 内 容 


Unix 通过 将 可 执行 代码 载 人 进程 并 执行 它 来 运行 一 个 程序 。 进 程 是 运行 一 个 程序 
所 需 的 内 存 空 间 和 其 他 资源 的 集合 。 

每 个 运行 中 的 程序 在 自己 的 进程 中 运行 。 每 个 进程 都 有 一 个 惟一 的 进程 D, 所 有 
者 .大 小 及 其 他 属性 。 

系统 调用 fork 通过 复制 进程 来 建立 一 个 几乎 和 原来 进程 完全 相同 的 副本 进程 。 这 
个 新 建 的 进程 被 称 为 子 进程 。 l 

一 个 程序 通过 调用 exec e& TU Ye 4 AEE P PUT — TF. 

一 个 程序 能 通过 调用 wait 来 等 待 子 进程 结束 .。 

调 几 程序 能 将 一 个 字符 串 列表 传 给 新 程序 的 main 西数 。 新 的 程序 能 通过 调用 exit 
来 回 传 一 个 8 位 长 的 值 。 

Unix shell 通过 调用 fork .exec 和 wait 来 运行 程序 。 

进一步 的 问题 


shell 运行 程序 ,同时 shell 也 是 -- 种 编程 语言 。 下 面 将 学 习 shell 的 脚本 语言 。 还 要 看 
看 如 何 修改 程序 以 支持 脚本 控制 逻辑 和 变量 。 


3. 


习题 


8.1 M fork 返回 的 值 能 够 区 分 父 进 程 还 是 子 进程 ? 还 有 其 他 的 办 法 做 到 这 一 点 吗 ? 
8.2 预测 下 面 程序 的 输出 ; 


main() 
i 
int n; 
forín = 0; n-Z10 ; n** ) 
1 
printf("my pid = $d, n = dn", getpidO , m; 


sleep(1); 
if (fork() t= 0) /* what if these two «/ 
exit(05; /* lines were removed «/ 


} 
} 


如 果 把 有 注解 的 两 行 删除 ,结果 又 会 如 何 ? 


psh2. c 使 用 了 定 长 的 数组 来 存放 参数 列表 ,如 何 收 改 程序 才能 去 掉 用 户 输入 命 
令 参 数 个 数 的 限制 ?这 样 的 改动 有 必要 吗 9 这 就 是 说 ,Unix 是 否 限 制 了 exec 可 
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接受 的 参数 长 度 或 个 数 ? 
8.4 考虑 以 下 代码 : 


maint) 

{ int fd; 
int pid; 
char msgi[] = "Test 123 ..\n"> 
char msg2[ ] = "Hello, hello\n"; 


if ( (fd = creat(tesefile, 0644)) == - 1) 
return D; 
if( write(fd, msgl, strien(msgi)) == -—1) 


return 0: 


if ( (pid = fork()) == - 1} 
return D; 

if ( write(fd, msg2, strlen(msg25) == -1) 
return 0; 

claose( fd}; 


return 1; 


1 


测试 这 个 程序 。 调 用 fork 之 后 两 个 进程 都 有 一 个 指向 同一 个 输出 文件 并 日 具有 
相同 的 当前 位 置 的 文件 措 述 符 。 文 件 中 会 有 郊 条 记录 ? 能 否 从 记录 的 条 数 得 知 
文件 描述 符 利 连接 的 文件 ? 


8.5 考虑 下 面 代码 ，; 


# include <I stdio. h> 


maint } 
: 
FILE x fp; 
int pid; 
char msgl[] = "Test 123 ..Xn"; 
char msg2; ^ = "Hello, hello\n"; 
if( (fp = fopen("testfile2", "w")) == NULL) 
return 0; 


fprintf(fp, "& s", msgl?; 
if ( (pid = fork()) == -1} 
return 0; 
fprintf(fp," $ 5", msgz) ; 
fclose(fp}; 
return 1; 
} 


测试 这 个 程序 。 文 件 中 有 多少 条 记录 ? 解释 一 下 结果 。 将 这 个 程序 的 输出 与 课 
本 中 的 forkdemol. c 的 输出 比较 一 下 。 
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8.6 编译 并 运行 以 下 程序 ， 


8.7 


main) 
1 
int i; 
if (fork() 1= 0) 
exit(0; 
for i=1 ; ic 10 ;i45)4| 
printf("still here. .Xn' 
sleep(i); 
1 
return 0; 
i 


REPT HST AeA TIER), Unix shell 多 许 用 户 在 后 人 台 运 行程 序 。 这 个 程 


序 与 后 台 进 程 有 什么 相似 之 处 ? 


如 果子 进程 运行 失败 ,程序 调用 exit。 调 用 exit 看 起 来 很 极端 。 为 什么 不 仪 仪 从 
BRC FA Ge P A SARS Y 


4， 编 程 练习 


8.8 


8.9 


8. 10 


8. 12 


扩展 waitdemol. c 的 功能 ,使 之 建立 两 个 进程 ,并 等 待 两 个 进程 部 结 束 。 
进一步 扩展 你 的 程序 使 之 能 从 命令 行 接受 整数 。 然 后 程序 创立 该 整数 指定 的 进程 数 。 
分 配 每 个 进程 一 个 随机 的 睡眠 时 间 。 最 后 , 父 进程 报告 每 个 子 进程 的 退出 。 





写 个 程序 来 帮助 理解 SIGCHLD, rt waitdemo2. e, E SIGCHLD 信号 的 处 理 
网 数 。 然 后 执行 循环 ,每 一 秘 打 印 一 次 "waiting"。 当 子 进程 退出 ,程序 打印 消息 ， 
报告 退出 原因 然后 退出 。 


写 一 个 程序 接受 一 个 整数 作为 参数 ,然后 创建 参数 指定 个 数 的 子 进程 。 每 个 子 
进程 睡眠 5 秘 钟 ,然后 退出 。 父 进程 设置 SIGCHLD WIA SARAM. RAHA 
循环 ,每 秘 打 印 一 次 消息 。 信 和 号 处 理 函 数 调用 wait, 然 后 打印 子 进 程 的 ID, 最 后 
将 计数 器 增 1。 当 计数 器 达到 建立 的 子 进程 数 时 ,程序 退出 。 用 不 同 数目 的 子 进 
程 数 来 测试 程序 。 当 子 进 程 数 很 大 时 程序 可 能 会 琉 失 -~- 些 子 进程 退出 的 消息 ， 
FER RAT ASA BERG? 有 没有 办 法 解决 ? 


修改 psh2.c 使 之 在 用 户 输 入 “exit? 或 遇 到 文件 结束 时 退出 。 


当 有 子 进 程 在 运行 时 ,标准 Unix shell 在 用 户 发 送 中 断 或 退出 傅 号 时 并 不 终止 。 
接受 命令 行 时 ,标准 的 Unix shell 如 何 响应 这 些 信和 叶 ? 修改 psh2. ce, 使 之 像 一 个 
标准 的 shell 那样 工作 ， 
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概念 与 技巧 

Unix shell 是 一 种 编程 语言 

* 什么 是 shell 脚本 语言 ? shell 如 何 处 理 脚 本 语言 ? 
shell 如 何 处 理 结构 化 的 工作 ? exit(0) = success 
* 为 什么 需要 shell 变量 以 及 如 何 使 用 shell 变量 

。 HAAR? 它 是 如 何 工 作 的 ? 

相关 的 系统 调用 


* exit 


* getenv 


相关 命令 


* env 


9.1 shell 编程 


TE shell 中 可 以 运行 程序 ,而 shell 本 身 就 是 一 种 编程 语言 。shell 程序 ,一 般 称 之 为 sheli 
脚本 ,是 Unix KHER Unix 的 引导 穆 序 和 很 多 管理 程序 都 使 用 shell 脚本 。 本 章 中 , 首 
先 学 习 shell 的 编程 特征 。 然 后 在 上 一 章 编写 的 shell 程序 中 增加 一 些 特征 ,将 让 .then 控制 
语句 ,局 部 变量 和 全 局 变量 添加 到 要 实现 的 shell 程序 中 ， 


9.2 什么 是 以 及 为 什么 要 使 用 shell 脚本 语音 


shell 是 一 个 编程 语言 解释 器 ， 这 个 解释 器 解释 从 键盘 输入 的 命令 ,也 解释 存储 在 脚本 中 
的 命令 序列 。 


shell 脚本 包含 一 系列 命令 “ 
shell 短评 是 一 个 包 全 一 系列 命令 的 文件 ， 运 行 -- 个 脚本 就 是 运行 ix ox dB BET S 
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。 可 以 用 一 个 shell 脚本 在 一 次 请 求 中 来 执行 多 个 命令 。 下面 是 一 个 例子 : 


# this is called scriptů 

# it runs some commands 

ls 

echo the current date/time is . 
date 

echo my name is 


whoami 


前 两 行 是 注释 。shell 忽略 以 字符 # 井 开始 的 行 ,脚本 的 余下 部 分 四 命令 组 成 ,shell E 


执行 命令 直到 文件 末尾 或 者 shell 执行 到 exit 命令 ， 


可 以 把 脚本 文件 名 作为 参数 传 给 shell 来 执行 脚本 : 


$ sh scripto 

scriptO scriptl script2 script3 
the current date/time is 

Sun Jul 29 23:29:49 EDT 2001 
my name is 

bruce 


E 
还 可 以 通过 设置 文件 的 执行 权限 ,然后 输入 文件 名 来 执行 脚本 ， 


$ chmod + x scripto 

$ scripto 

scriptů script] script? script3 
the current date/time is 

Sun Jul 29 23-31;23 EDT 2001 
my name is 

bruce 


$ 


对 于 一 个 脚本 只 需要 执行 一 次 chmod, 可 执行 位 将 保持 不 变 直 到 下 一 次 再 改变 它 。 用 第 


二 种 方法 ,也 就 是 用 改变 文件 可 执行 属性 的 方法 来 启动 脚本 会 更 加 方便 。 将 脚本 设置 成 可 
执行 的 ,然后 像 运 行 系统 命令 或 自己 编写 的 程序 一 样 来 执行 脚本 。 


将 使 用 哪个 shell? 我 们 将 学 习 和 编写 脚本 的 shell 是 一 个 早期 版 本 的 Unix shell; sh 的 


语法 , 它 被 称 为 B shell(Beurne Sheil) ,这 是 根据 编写 这 个 程序 的 人 的 名 字 来 命名 的 。 过 去 
的 几 年 中 有 很 多 不 同 的 shell 被 实现 ,它们 各 有 各 的 特点 或 语法 。 这 里 将 学 习 的 语法 在 大 宁 
数 shell 中 是 相同 的 ,包括 sh. bash 和 ksh, 


l. sh 的 编程 特征 :变量 .I/O 和 if, . then 
shell 脚本 是 真正 的 程序 。 注 意 在 script? 中 体现 的 特点 ， 
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#1 bin/sh 
# script2 : a real program with variables, input, 


# and control flow 


BOOK = sHOME, phonebook. data 
echo find what name in phonebook 
read NAME 
if grep $ NAME $ BOOK — /tmp/pb. tmp 
then 

echo Entries for $ NAME 

cat /tmp/pb. tmp 
else 

echo No entries for 5 NAME 
Ti 
rm /tmp/ pb. tmp 


下 面 是 script2 的 输出 ， 


S ./seript2 

find what name in phonebook 
dave 

Entries for dave 

dave 432 - 6546 

5 ./seript2 

find what name in phonebook 
fran 

No entries for fran 

$ cat SHOME/phonebook. data 


ann 222 一 3456 

bob 323 一 2222 

carla 123 — 4567 

dave 432 — 6546 

eloise 567-9876 

$ 

脚本 中 除了 命令 之 外 还 包括 以 下 元 素 。 
(D 变量 


脚本 中 可 以 定义 变量 。 在 script2 中 ,定义 了 名 为 BOOK 和 NAME 两 个 变量 ,并 在 定义 
之 后 使 用 了 它们 ,用 前 铁 $ 来 取得 变量 的 值 。 变 量 各 不 一 定 要 大 写 , 只 是 习惯 上 将 其 大 写 。 

(2) 用 户 输 人 

read 命令 告诉 shell 要 从 标准 输入 中 读 人 一 个 字符 串 。 可 以 便 用 read 来 创建 交 生 的 肢 
本 , 电 可 以 从 文件 或 管道 中 读 人 数据 。 

(3) 控制 

这 个 脚本 包括 了 if.. then.. else, .下 控制 语句 。 其 他 的 脚本 控制 语句 还 有 while. case 
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和 for, 

(4) 环境 

脚本 使 用 一 个 名 为 HOME REE. HOME 的 值 是 你 的 主 目录 的 路 径 。HOMT 变量 是 
由 login 程序 设置 的 ,可 以 被 login 进程 的 所 有 子 进程 使 用 。HOME 变量 是 多 个 环境 挛 1 
(environment variables) 中 的 一 个 。 这 些 环境 变量 记录 了 个 性 化 设置 。 而 这 些 设置 能 影响 很 
多 程序 的 行为 。 比 如 ,TZ 变量 记录 了 当前 的 时 区 。 将 TZ 设置 为 "EST58DT" 是 告诉 那些 使 用 
ctime 的 程序 ,比如 date 或 18 -1 应 该 显示 美国 东部 时 间 。 本 章 后 硬 会 学 习 环 境 变量 的 作 
用 和 和 结构。 

2. Á shell 的 改进 

在 上 一 章 用 fork.execvp 和 wait 实现 了 一 个 能 够 创建 进程 和 运行 程序 的 shell, Ak 
中 ,将 对 这 个 shell 懒 一 些 改 进 。 首 先 ,将 加 入 命令 行 解 析 。 这 样 用 户 就 能 够 在 一 行 中 输入 命 
令 和 所 有 参数 了 。 然 后 ,将 控制 语句 if.. then 加 人 到 这 个 shell 中 。 最 后 将 加 入 局 部 变量 和 
环境 变量 ， 














9.3 smshl 一 一 命令 行 解析 


对 自 编 shell 的 第 一 个 改进 是 添加 命令 行 解析 的 功能 。 这 个 版 本 命名 为 smshl.c。 用 户 
现在 可 以 在 一 行 中 输入 ;比如 ; 


find /home — name core - mtime +3 ~ print 


然后 由 解析 器 将 命令 行 拆 成 字符 串 数 组 ,以 便 传 给 execvp。 程 序 主 要 流程 如 图 9. 1 所 示 。 
对 psh2. c 的 改进 包括 将 命令 行 分 解 成 参数 数组 ,在 shell 中 忽略 信号 SIGINT 和 SIGQUIT. 
但 是 在 子 进 程 中 恢复 对 信和 号 SIGINT 和 SIGQUIT 的 默认 操作 ,允许 用 户 通 过 按 表 示 辣 束 文 
件 的 Ctrl- D 键 来 退出 ， 








ignore signals 
0 — get command 一 一 一 一 — exit 
split line 
| 
| fork 一 
| 
wait enable signals 
execvp 








| | | 
|_| d 


图 9.1 一 个 有 信号, 通 出 和 解析 的 shell 
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shell &j 3E RA F: 


int main() 


{ 
char x cmdline, * prompt, * * arglist; 
int result, 


void setup); 


prompt = DFL PROMPT ; 
setup(); 


while ( (emdline = next cmd(prompt, stdin)) != NULL ){ 
if ( (arglist = splitline(cmdline)) ! = NULL )! 
result = execute(arglist); 
freelist(arglist}; 


} 


free(cmdline); 


} 


return 0; 


} 
3 个 函数 的 解释 如 下 。 


(1) next, cmd 

next cmd 从 输入 流 中 读 入 下 一 个 命令 。 它 调用 malloc 来 分 配 内 存 以 接受 任意 长 度 的 
命令 行 。 磁 到 文件 结束 符 , 它 返回 NULL. 

(2) splitline 

splitline 3 —4-*£ f$ 8 4 Hg 5e fp BC ,并 返回 这 个 数组 。 它 调用 maloe 3 4 Be P3 E 
以 接受 任意 参数 个 数 的 命令 行 。 这 个 数组 由 NULL 标记 结束 。 

(3) execute 

execute 使 用 fork .execvp 和 wait 来 运行 一 个 命令 。exeeute 返回 命令 的 结束 状态 、 

smsh1 由 3 个 文件 组 成 :smshl.c.splitiine. c 和 execute. ec。 用 以 下 命令 来 编译 和 运行 这 
个 程序 : 


$ oo smBhi.c splitline.c exeacute.c - o smshl 

$ ./seghi 

—ps -f 

UID PIB PPID c STIME TTY TIME CHD 
bruce 23203 23199 0 Jui29 pts/4 00:00-00 bash 
bruce 25383 23203 Q 08:23 pts/4 00.00.00 . (sushi 
bruce 25385 25383 0 08:23 pts/4 00:00:00 ps -f 
o> 7 BR Ctrl-D & 

$ 


注意 ps —£ 是 . /smshl 的 子 进程 。 /smshl 是 bash 的 子 进程 。 下 面 是 smshl.c 的 代码 ; 
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fo smshl.c small - shell version i 
x first really useful version after prompting shell 
*»» this one parses the command line into strings 
»* uses fork, exec, wait, and ignores signals 
xe f 


# include  «stdio. h> 

# include «stdlib.h— 
H include  «unistd. ho 
# include < signal. h> 


# include "smsh. h" 


# define DFL PROMET ">" 


int main() 

{ 
char * cmdline, * prompt, * x arglist; 
int result; 


void setup(); 


prompt - DFL PROMPT ; 
setup(); 


while ( (cmdline = next cmd(prompt, stdin)) |= NULL ){ 
if ( €arglist = splitline(cmdline)) |= NULL OM 
result = execute(arglist) ; 


freelist(arglist); 
} 
free(cmdline); 


} 


return 0; 


void setup() 
jx 
* purpose; initialize shell 
* returns; nothing. calls fatal() if trouble 
xf 
1 
signal(SIGINT, SIG IGN); 
signal(SIGQUIT, SIG IGN); 


void fatal(char * sl, char * s2, int n) 
t 


fprintf(stderr, Error. %8, % s\n", sl, s2); 


F 


exit(n) ; 
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直面 是 execute. c FALE: 


/* execute.c - code used by small shell to execute commands */ 


# include :<stdio.h> 

# include  -stdlib. hc 
# include <unistd.h> 
# include «signal. hi> 


E include < sys/wait, h> 


int execute(char * argv[ j) 
fe 
* purpose; run a program passing it arguments 


* returns; status returned via wait, or — 1 on error 


* errors: — lon fork() or wait() errors 
«f 
1 
int pid : 
int child info = -1; 
if (Cargv[0] == NULL) /* nothing succeedsx/ 
return 0; 
if ( (pid = fork(}) == -1) 


perror("fork™) ; 
else if ( pid == 034 
signal(SIGINT, SIG DFL); 
signal(SIGQUIT, SIG DFL); 
execvp(argv[0,, argv); 
perror( "cannot execute command"); 
exit(1); 
} 
else { 
if ( wait(&child info) == -1) 
perror("wait"); 
} 


return child info; 


FG splitline. c 的 代码 : 


/* splitline.c — commmand reading and parsing functions for smsh 
* 
* char * next cmd(char * prompt, FILE x fp) 一 get next command 


* char wx splitline(char * str); - parse a string 
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&/ 


E include «stdio. h> 
# include  «stdlib. h> 
# include «string. K> 


Ħ# include  "smsh.h" 


char * next cmd(char * prompt, FILE x fp) 


i* 


* purpose; read next command line from fp 


x 


* 


* 


* 


returns; dynamically allocated string holding command line 


errors: NULL at EOF (not really an error) 
calls fatal from emalloc() 


notes: allocates space in BUFSIZ chunks. 


* i 


char * buf ; 


int bufspace = 0; 
int pos - 0; 
int es 


F 


printf("$ s", prompt); 


while( ( c = getc(fp)) t= EOF) { 


/* need space? »/ 


if( post+ 1 “>= bufspace )i 
if ( bufspace == 0) 
buf = emalloc(BUFSIZ); 


elsé or expand «/ 


f* the buffer «/ 


fx total size x/ 


/* current position x/ 


/* input char x/ 


/* prompt user */ 


/* 1 for \0 x; 


/* y: lst time «/ 


buf = erealloc(buf,bufspace + BUFSIZ) ; 


bufspace += BUFSIZ; 


Y 
了 


/* end of command? x/ 
if (e == n: 
break; 


/* no, add to buffer «/ 


buf[pos*t* | = c; 
} 


if ( c == EOF && pos == 0} 


reiurn NULL; 
buf[pos] = 'i0'; 


return buf; 


/* update size #/ 


/* EGF and no input »/ 


/* say so */ 
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** splitline ( parse a line into an array of strings ) 


e f 


f define is_delim(x) (fx == 1 ![l == "ÁO 


char * splitline(char » line) 
/* 


* purpose: split a line into array of white - space separated tokens 


* returns a NULL 一 terminated array of pointers to copies of the 


x tokens or NULL if line if no tokens on the line 


* action. traverse the array, locate strings, make copies 


* note; strtok() could work, but we may want to add quotes later 


*/ 


Char * newstr(); 
char ** args ; 

int spots = 0; 
int bufspace = 0; 
int argnum = 0; 
char *cp = line; 
char * start; 


int len; 


if ( line == NULL ) 
return NULL; 


args = emalloc(BUFSIZ); 
bufspace = BUFSIZ; 
spots = BUFSIZ/sizeof(char «2; 


while( «cp t= "\O") 
1 
while ( is delim( * cp) } 
cpt+t; 
if( &cp == Mo") 
break; 


/* spots in table «/ 
/* bytes in table x/ 
/* slots used */ 


/* pos in string af 


/* handle special casex/ 


/* initialize arrays/ 


/* skip leading spaces *#/ 


/* quit at end - o- string */ 


/* make sure the array has room (+1 for NULL) x/ 


if ( argnum + 1 “>= spots ){ 


args = erealloc(args,bufspace + BUFSIZ); 


bufspace += RUFSIZ; 


spots += (BUFSIZ/sizeof(char x )); 


} 


/* mark start, then find end of word »/ 


start = cp; 


len = 1; 


f 


while (***cpl- NO && ! (is delim( » cp?) ) 
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len 十 十 
args{arqnum++ ] = newstr(start, len); 
} 
args[argnum] = NULL; 
return args; 


} 
fe 


* purpose; constructor for strings 
* returns; a string, never NULL 
wf 

char * newstr(char xs, int 1) 

{ 


char *rv = emalloc(l +1); 


rw[1] = '&0*; 
sirncpyirv, s, 1); 


return rv; 


void freelistíchar x*« list) 
js 
* purpose: free the list returned by splitline 
* returns: nothing 
* action; free all strings in list and then free the list 
xf 
i 
char **cp = list; 
while( x cn) 
free( «cp t); 
free(list); 
} 


void + emalloc(size t n) 
{ 
void *rv; 
if ( (rv = malloc(n)) == NULL) 
fatalt "ont of memory", "" 1); 
return rv; 
} 
void * erealloc(void * p, size t n) 
í 
void # rv; 
if ( (rv = realloc(p,n)) == NULL) 
fatal("realloc() failed", "",1); 


return rv; 
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} 
下 面 是 smsh. h 的 代码 ， 


# define YES 1 
# define NO Q 


char  * next cmd(); 

char *x*splitline(char +); 

void freelist(char s*); 

void »* emalloc(size E); 

void x erealloc(void * , size_t); 
int execute(char s»); 


void fatal(char «, char * , int); 


关于 smshl BUDE 
smshl 比 psh2 要 好 用 很 密 ,改进 的 方面 主要 包括 以 下 一 些 : 
OD -- 行 多 个 命令 
通常 的 shell 允许 用 分 号 分 隔 命 令 , 这 样 用 户 就 可 以 在 一 行 中 输入 多 个 命令 本: 





ls demodir; ps - f ; date 


(2) 后 台 进 程 

通常 的 shell 允许 用 户 通 过 在 命令 的 结尾 加 上 与 符号 (名 ) 来 使 其 在 后 台 运 行 , 如 ;: 

find /home — name core print & 

在 后 台 运 行 一 个 程序 意味 着 一 旦 启动 它 ,系统 将 立即 返回 提示 符 , 这 个 进程 可 能 还 没有 
结束 ,但 已 经 可 以 在 提示 符 后 输 人 命令 并 运行 其 他 进程 了 。 这 听 起 来 有 点 复杂 ,实际 上 实现 
是 非常 简单 。 看 看 流程 图 , 想 想 是 刘 何 不 等 待命 令 结束 而 返 世 提示 符 的 。 想 法 很 简单 而 且 
漂亮 ,但 是 要 处 理 信 号 和 防止 伪 忆 (Zombies) 进 程 ,这 有 点 像 惊险 片 。 

(3) 退出 命令 

通常 的 shel 允许 用 户 通 过 输 人 exit 来 退出 shell, exit 命令 接受 一 个 整数 参数 ,比如 
exit 3, 这 种 情况 下 ,这 个 数字 被 作为 参数 传 给 exit BRK, 


9.4 shell 中 的 流程 控制 


对 原 有 的 shell 的 第 2 个 改进 是 增加 if.. then 控制 语句 。 
9.4.1 if RIKENA 
shell 提供 计 控 制 语句 。 假 设 你 计划 每 周 五 做 磁盘 备份 。 考 虑 -下 以 下 例子 ， 














if date|grep Fri 
then 
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echo time for backup. Insert tape and press enter 
read x 
tar cvf /dev/tape /home 

fi 


shell 中 的 计 语 名 的 作用 与 其 他 语言 的 让 语句 相同 :条件 检测 。 如 果 条 件 的 值 为 正 , 则 有 


一 部 分 代码 被 执行 。 在 shell 中 ,条 件 是 一 个 命令 ,返回 正 值 意味 着 命令 运行 成 功 。 
在 例子 中 ,命令 是 date|grep Fri, 这 个 命令 在 date 的 输出 字符 串 中 查找 "Fri 字符 串 , 如 





” 果 找 到 则 命令 成 功 ,否则 命令 失败 。 程序 是 如 何 才 了 示 成 功 的 呢 ? 











C1) exi COO (RR 

grep AF TAA BR BE exit(0) 来 表明 成 功 。 所 有 的 Unix 程序 都 遵从 以 0 退出 表明 成 功 这 
-- 惯 例 。 比 如 ,diff 命令 用 来 比较 两 个 文本 文件 ， 如 果 两 个 文件 相同 ,diff 返回 0 以 表明 成 
T). RAR my cp 和 rm 都 以 相同 的 方式 表明 成 功 。 脚 本 中 的 计 .then 语 他 基于 以 0 退出 
表示 成 荔 这 个 假设 

(2) 4747 else B) if 8 8] 

一 个 ibi RIRTEUÉ else 部 分 ,比如 ; 


ls 

who 

if diff filel filel. bak 

then 
echo no differences found, removing backup 
rm filel.bak 

else 
echo backup differs, making it read - only 
chmod -w filel.bak 

fi 

date 


else 部 分 就 像 then 部 分 一 样 ,可 以 包含 任意 数量 的 命令 ,包括 其 他 的 if.. then 语句 。 
i 语句 还 有 男 一 个 特征 。 如 果 过 后 的 条 件 是 一 系列 的 命令 ,那么 最 后 一 个 命令 的 exit (B 
被 用 作 这 个 语句 抉 的 条 件 值 ,并 由 此 来 决定 条 件 是 否 成 立 。 


9.4.2 证 是 恕 何 工作 的 


if AA ERA EB 。 

(OD shell 运行 让 之 后 的 命令 。 

(2) shell 检查 命令 的 exit 状态。 

(3) exit 的 状态 为 0 意味 着 成 功 , 非 0 意味 着 失败 。 
(4) 如 果 成 功 ,shell 执行 then 部 分 的 代码 。 

(5) 如 果 失 败 shell 执行 else 部 分 的 代码 。 

(6) KEF fi tik 计 块 的 结束 。 
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9.4.3 在 smsh 中 增加 并 


现在 已 经 知道 [ 控制 语句 做 什么 ,也 知道 它 是 如 何 二 作 的 。 那 么 如 何在 shell 中 增加 if 
语句 呢 ? 

这 里 已 经 知道 如 何 运 行 ~- 个 命令 一 一 调用 cxecute。 也 知道 如 何 稳 查 一 个 程序 的 退出 状 
态 一 -从 wait 丽 数 中 得 到 。 需 要 将 计 之 后 命令 的 结果 存放 在 一 些 变 量 中 ,然后 训 知 道 后 面 
读 人 的 命令 是 在 then 块 中 ,还 是 else 块 中 。 最 后 还 得 确保 在 计 之 后 读 人 then, 

(1) 增加 一 层 :process 

要 实现 这 些 功 能 ,原来 的 模型 就 有 些 太 简 单 。smshl 的 控制 流 从 splitiine 直接 到 fork, 
每 个 命令 都 被 直接 传 给 exeec。 新 的 版 本 中 ,以 if then 或 者 五 开始 的 行 和 条 件 失败 时 then 语 
名 块 中 的 命令 行 不 传 给 exec。 添 加 if 语 杀 后 使 命令 处 理 变 得 复杂 ,所 以 要 写 一 个 名 为 
process 的 函数 来 包含 这 些 复杂 的 代码 。 修 改 后 的 流程 图 如 图 9. 2 BER. 





smishl smsh2 
ignore signals ignore signals 

-一 -到 get command —— exit r- —» get command —— — exit 
| split line | split line 
| 1 | control command? 
| p— fork 一 A | |^ 
| wait enable signals | p— fork —— —, 

1 

*— execv, ， ， 
| | P | wail enable signals 方 框 内 是 函数 
| | n | execvp process 
Ld a exit | 
L 





图 9.2 在 smsb PIF HBR 


(2) process 做 些 什 么 

process 通过 寻找 关键 字 , 比如 if chen 和 fi, 来 管理 脚本 流程 ,在 适当 的 时 蛋 调 用 fork 和 
exec, process 必须 记录 条 件 命令 的 结果 以 便 能 够 处 理 then 和 else 块 。 

(3) procss 是 如 何 工作 的 ? 代码 区 域 .运行 状态 

process 将 脚本 看 作 一 个 接 一 个 的 代码 区 域 。 第 1 个 区 域 是 then 代码 块 ,第 2 个 是 else 
代码 块 ,第 3 个 是 在 过 语句 之 外 的 代码 块 。 就 像 图 9. 3 所 示 , 对 于 不 同 的 区 域 ,shel 的 处 理 
方法 也 是 不 同 的 。 

考虑 计 语 名 之 外 的 区 域 , 这 里 称 之 为 中 立 区 (neutral) 。 对 于 这 类 区 域 的 代码 ,简单 地 读 
一 条 ,分析 一 条 ,执行 一 条 

接 下 来 是 在 这 和 then ZAM RM, ARRP shell 每 执行 一 条 命令 就 记录 下 它 的 退 
出 状态 , 另 一 个 区 域 是 从 then 到 下 或 else 之 间 , 最 后 一 个 区 域 是 从 else 3[ fi, TE fi zr XL gl. 
到 中 立 区 了 ， i 

shell 记录 当前 区 域 类 型 ,还 必须 记录 在 WANT THEN 区 域 中 所 执行 命令 的 结果 。 
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区 域 shell 的 输入 序列 


ls 





rax who 
if diff filel filel.bak 


want-then then 
rm filei_bak 
then-block echo removing backup 
else 
else-block chmod -w filel hak 
中 立 区 





图 9.3 由 不 同 区 域 组 成 的 脚本 


不 同 区 域 的 处 理 方 法 是 不 同 的 。 特 定 的 区 域 与 程序 的 特定 状态 联系 在 一 起 。process 通 
过 3 个 函数 来 处 理 区 域 问题 ， 

(1) is contro] command ` 

is control command 返回 一 个 boolean 变量 告诉 process 这 条 命令 是 脚本 语言 的 一 部 分 
还 是 一 条 可 执行 的 命令 ， 

(2) do, control command . 

do control command 处 理 关 键 字 if then M fi。 每 个 关键 字 都 是 区 域 的 界 标 。 这 个 函 
数 更 新 状态 变量 并 执行 必要 的 操作 。 

(3) ok to execute 

ok to. execute 根据 当前 的 状态 和 条 件 命 令 的 结果 返回 一 个 boolean 值 ,说 明 能 否 执行 
当前 命令 。 


9.4.4 smsh2.¢; 修 改 后 的 代码 


smsh2.c 是 基于 smshl.c Hj, main BR c FLOR — RE TELE le) — execute 的 地 方 调 
用 process T : 


fee smsh2.c - small- shell version 2 
ee small shell that supports command line parsing ` 
» and if..then. . else. fi logic (by calling process()) 
xf 
# include <stdio.h> 
include <stdlib. b> 
H include  «unistd. h> 
# include «signal. h> 
# include <(sys/wait. ho> 
# include "smsh. h" 


#define DFL PROMPT "> " 


int main() 
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char «cmdline, x prompt, *+* arglist; 
int result, processt(char »x). 


void setup(); 


prompt = DFT, PROMPT ; 
setup(); 


while ( (cmdline = next cmd(prompt, stdin)) |= NULL ){ 
if ( (arglist = splitline(cmdiine)) | = NULL | 
result = process(arglist); 
freelist(arglist); 
} 
free(cmdline) ; 
} 


return 0; 


void setupt } 
jx 
* purpose; initialize shell 
* returns; nothing. calls fatal() if trouble 
xf ! 
i 
Signal(SIGINT, SIG IGN}; 


signal(SIGQUIT, SIG IGN); 


void fatal(char * sl, char * 82, int n) 
{ 
fprintf(stderr, "Error: $s, & sin', sl, $2); 


exit(n) ; 


还 添加 了 两 个 新 文件 process. c 利 controlflow. c; 


/* process.c 
* command processing layer 
x 
* The process(char ** arglist) function is called by the main loop 
* It sits in front of the execute() function. This layer handles 
* two main classes of processing: 
* a) built- in functions (e.g. exit(), set, =, read, .. ) 


* b) control structures (e.q. if, while, for) 


x A 


# include  «stdio. ho 
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H include  "smsh.h" 


int is control command(char * 2; 
int do control command(char «**J; 


int ok to execute(); 


int process(char ** args) 
/Á* 

* purpose; process user command 

* returns; result of processing command 

* details; if a built — in then call appropriate function, if not 

execute() 
* errors: arise from subroutines, handled there 
af 


int rv = 0; 


if ( args[ 0, == NULL) 
rv = Ü; 
else if ( is control command(args[0 ]) ) 
rv = do control command(args); 
else if ( ok to execute() ) 
rv - execute(args) ; 


return rv; 
/* controlflow.c 


x "if" processing is done with two state variables 
* if state and if result 

x/ . 

d include  «stdio. b> 


# include  "smsh. n" 


enum states | NEUTRAL, WANT THEN, THEN BLOCK |; 
enum results {| SUCCESS, FAIL }; 


static int if state - NEUTRAL; 
static int if result = SUCCESS; 
static int last stat = 0; 


int syn err(char x*); 


int ok to execute() 

fs 
* purpose: determine the shell should execute a command 
x returns: 1 for yes, 0 for no 


* details : if in THEN BLOCK and if result was SUCCESS then yes 
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x if in THEN BLOCK and if result was FAIL then no 
* if in WANT THEN then syntax error (sh is different) 
xf 
i 
int rv = 1 ; /* default is positive x/ 


if ( if state == WANT THEN )| 
5yn err( "then expected"); 
rm = 0; 
t 
else if ( if state == THEN BLOCK && if result == SUCCESS ) 
rv = 1; 
else if ( if state == THEN BLOCK && if result == FAIL) 
rv = D; 
return rv; 


} 


int is control command(char * s) 
fe 

* purpose; boolean to report if the command is a shell control command 
* returns: 0 or 1 

xf 

1 

return (strcmp(s,"if") -- 0 || strempts, "then" ) ==0 || 
strcmp(s,"fi")--20); 


int do control command(char * * args) 
fs 
* purpose: Process "if", "then", "fi" — change state or detect error 
* returns; 0 if ok, — 1 for syntax error 
x/ 
1 
char  * cmd = args[0]; 


int rv = ~l: 


F 


if ( stremp(emd, "if") «2 0 0| 
if ( if state |= NEUTRAL ) 
rv = syn err("if unexpected"); 
else { 
last stat = process(args+ 1); 
if result = (last stat == 0 7 SUCCESS ; FAIL); 
if state = WANT THEN; 
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else if ( strcmp(cmd, "then") ==0 ){ 
if ( if state |= WANT THEN ) 
rv = syn err("then unexpected"); 
else { 
if state - THEN BLOCK; 


else if ( stromp(cmd, "fi") ==0 3} 
if ( if state | = THEN BLOCK ) 





rv = gyn err("fi unexpected"). 


else | 
if state = NEUTRAL; 
rv = Dr; 
i 
} 
else 
fatal("internal error processing;", cmd, 2); 
return rw; 


} 


int syn err(char * msq) 
/* purpose; handles syntax errors in control structures 
* details: resets state to NEUTRAL 
* returns; — 1 in interactive mode. Should call fatal in scripts 
xf 
{ 
if_state = NEUTRAL; 
fprintf(stderr, "syntax error: % s\n", msg}; 


return - 1; 


在 controlflow. c 中 ,if 语句 的 else 没有 被 处 理 ,这 一 部 分 留 作 读者 的 习题 。 


编译 并 执行 这 个 版 本 : 


$ cc -o sash? smsh2.c splitline.c execute. c process, c controlflow.c 
$ ./smsh2 

<> grep lp /etc/passwd 
lpix:4;7:lp:/var/spool/lpd; 
~ if grep lp /ete/passwd 
lpix:4i"7:lp:/var/spool/lpd: 
=> then : 

=> echo ok 

ok 


T Fi 
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“> if grep pati ‘etc/passwd 
“> then 

“= echo ok 

=> fi 

=» echo ok 

ok 

> then 


Syntax error; then unexpected 


做 得 如 何 ? 


看 起 来 做 得 不 错 。 那 么 和 常用 的 shell poule sie X. on fag ge? 


$ if grep lp /etc/passwd 

5 then 

$ echo ok 

s £i 
lp:ix:4;7;:lp:/var/spool/lpd; 
ok 

$ 


这 个 shell 处 理 计 语句 的 方法 和 蜀 才 的 实现 有 些 不 同 。 标 准 的 shell 在 读 到 五 后 ,整个 
地 执行 if IR, EE ABIL? RA SEX A ORO 常用 的 shell 还 多 许 报 套 的 让 
语句 ,这 里 的 程序 能 做 修改 以 支持 嵌 套 的 计 庶 铝 吗 ” 


9.5 


shell 变量 :局 部 和 全 局 


像 其 它 的 程序 语言 一 样 ,Unix shell 也 有 变量 。 能 对 这 些 变量 赋值 ,也 可 从 这 些 变量 取 


值 , 列 出 所 有 变量 ,例如 以 下 的 代码 : 


$ age-7 

5 echo $ age 
7 

$ 


echo age 
age 
$ echo $ aget $ age 
Tt 7 
$ read nane 
fide . 
$ echo hello, $ name, how are you 
hello, fido, how are you 
$ ls > $ name.s age 
$ food = muffins 
food:not found 


3 


# assigning a value 


4 retrieving a value 


# the $ is required 


4 purely string operations 


# input from stdin 


# can be interpolated 


# used as a part of a command 


4no spaces in assignment 
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shell 包括 两 奖 变量 :局 部 变量 和 环境 变量 。 在 前 面 提 到 过 了 , 像 HOME 和 和 TZ 这 样 的 
变量 可 以 计 用 户 把 个 性 化 设置 传递 给 程序 ,这 些 变量 的 作用 有 点 象 全 局 变量 ,它们 可 以 被 所 
有 shell 的 隔 进 程 存 取 。 本 章 的 后 面 将 深入 了 解 环境 ,现在 ,只 要 记 住 有 两 类 变量 就 可 以 了 。 


9.5.1 4E FH shell 变量 
前 面 的 例子 演示 了 对 变量 的 大 部 分 操作 。 对 变量 的 操作 如 下 。 











操作 类 型 语 法 > 

赋值 var value 不 能 有 空格 

引用 Svar 

wR unset var 

输入 l read var 也 可 以 read var] var2... 
列 出 变量 set 

全 局 化 ' export var 





变量 名 是 字符 A-Z.:.0—93 Bü. HS EBSORBRROSUE. TEERDE 
敏感 的 。 

变量 的 值 是 字符 第 。 变 基 都 基 字 符 串 类 型 的 ,没有 数值 类 型 的 变量 。 所 有 的 党 作 都 是 
TARRE. 

列 出 所 有 变量 使 用 set 命令 。set 命令 列 出 当前 shell 定义 的 所 有 变量 ,例如 ， 





$ set 

BASH = /bin/bash 

BASH VERSION = 1.14.7(1) 
DISPLAY = :0.0 

RUID = 500 

HOME = fhome? bruce 
HOSTTYPE = i386 

IFS = 


LANG = en 

LANGUAGE = en 

LD LIBRARY PATH = /usr/lib:/usr/local/lib 
LOGNAME = bruce 

OPTERR = 1 

OPTIND = 1 

OSTYPE = Linux 

PATH = /bin;/usr/bin;/usr/X11R6/bin; ;/usr/local/bin;/home2/bruce/bin 
PPID = 30928 l 

PS4 = + 

PHD = /home2 /bruce/projs/ubook/src/ch05 
SHELL = “bin/bash 
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SHLVL = 2 

TERM = xterm 一 color 
UID= 500 

USER = bruce 

_= fbin/vi 

age = 了 


name = fido 
这 个 列表 中 包括 很 多 在 登录 时 设置 的 变量 ,加 上 两 个 后 面 新 增 的 局 部 变量 ， 
9.5.2 变量 的 存储 


要 在 shell 里 增加 变量 ,必须 有 个 地 方 能 存放 这 些 变量 的 名 称 和 值 , 而 且 这 个 变量 存储 系 
统 必须 能 够 分 辩 局 部 和 全 局 变 最 .下面 是 这 个 存储 系统 的 抽象 模型 








(1) EE 
变量 fii 是 否 为 全 局 变量 ? 
data “phonebook. dat" | n 
HOME "/home?2 /f ido" y 
TERM "£1061" y 





(2) 接口 (部分) 

VLstore(char * var,char * val) 增加 / 青 新 var=val 

VLookup(char * var) 取得 var 的 值 

VList 输出 列表 到 stdout 

《3) 实现 

可 以 用 链表 、hash 表 、 树 或 者 是 几乎 任何 数据 结构 来 实现 它 。 作 为 第 一 个 版 本 ,用 一 个 
结构 数组 ,其 中 的 每 个 变量 是 这 样 的 结构 ， 


struct vari 


char * str; /*name- val stringe/ 


vartab 


int global; /*&à booleans / 
Hh 


static struct var Lab[ MAXVARS |; 







如 图 9. 4 所 未 ， 
9.5.3 增加 变量 命令 : Built-ins 


已 经 有 地 方 存 放 变 量 了 ,但 还 要 增加 给 变 
量 赋值 , 列 出 所 有 变量 和 获取 变量 值 的 命令 。 
这 就 是 说 ,在 这 个 shell 中 ,用户 应 该 能 够 输入 ， 


图 9.4 shell 变量 的 存储 方式 


"> TERM = xtern 
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T set 
‘echo $ TERM 


set 是 shell 的 一 个 命令 ,而 不 是 一 个 由 shell 运行 的 程序 ,这 就 像 让 和 then 这 些 关 键 字 
由 shell 自己 处 理 一 样 。 为 了 将 set 与 要 被 执行 的 程序 区 分 开 ,将 set 设置 为 内 置 (built 一 in) 
的 命令 。 

命令 varname=value 告 沂 shell 在 变量 表 里 添加 一 项 ,赋值 请 名 也 是 内 置 的 命令 。 

为 了 增加 内 置 的 命令 到 这 个 shell 中 ,需要 对 流程 图 怖 男 外 的 -一 些 修改 。 存 调用 fork 和 
exec 之 前 必须 先 看 看 命令 是 答 是 shell 内 置 的 命令 ,如 图 9.5 Bra. 





smsh3 
ignore signals 
r 一 一 —. Beétcommand — — exit 
| - split line 
y 

[= 一 一 一 control command? 
| n 

y n 
| r—- built-in? 一 一 一 
| do built-in [7 fork — 一 

l 

Dan 一 一 wait enable signals 
| | execvp 
L — — — — — | exit 





E] 9.5 向 smsh PRANAB aS 


修改 process 函数 ,使 之 在 调用 fork/exec ZH MARE AABN MS: 


if ( args[0] == NULL) 
rv = 0; 
else if ( is control command(args[0]? ) 
rv = do control command(ardgs); 
else if ( ok to execute() )1 
if ( | builtin command(args,&rv) ) 
fv = execute(args); 


} 


新 的 函数 builtin command 将 检查 和 执行 内 置 命 令 合并 在 一 起 。 变量 rv 用 来 标识 状 
态 ,builtin_command 返回 一 个 布尔 值 ,并 修改 状态 变量 rv, 
builtin. c 的 代码 如 下 : 





/* builtin.c 
* contains the switch and the functions for builtin commands 


x/ 
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E: 
F 
# 
# 
# 


include  «stdio. ho 
include «string. hi> 
include  «ctype. h> 
include  "smsh.h" 


include  "varlib.h" 


int assignichar +); 
int okname(char * ); 


int builtin command(char ** args, int x resultp) 


] 


PN 
x 
* 


* 


#; 


} 


purpose; run a builtin command 


returns: 1 if args|0] is builtin, 0 if not 


details; test args|0] against all known built - ins. 


Pi 


int rv = 0; 


if ( stremp(args| 0], "set") == 0 
VLlistÓ; 
* resultp = 0; 


H 


else if ( strehr(args[0], '=') {= NULL ){ 
* resultp = assign(args|0 D; 
if C xresultp!- -1) 


} 
else if ( stremptargs[0], "export") == 0){ 
if ( args[1] |= NULL && okname(arge[1]) ) 
* resultp = VLexport(args[1]); 
else 
* resultp - 1; 
rv — ]; 
} 


return rv. 


int assign(char * str} 


ix 


Call functions 


/* 'set' command? x/ 


/* assignment cmd «/ 


/* x- y= 123 not ok x/ 


* purpose: execute name = val AND ensure that name is legal 


* returns; —1 for illegal ival, or result of VLstore 


* warning; modifies the string, but retores it to normal 


x; 


{ 


i 


char cp; 
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} 


int «Iv; 

cp = strchr(str,'='}; 

* cp = MO, 

rv = ( okname(str) ? Vistere(str,cp+1) : = 1; 
xcp = te E 


return rv; 


int okname(char x str) 


fs 


* purpose; determines if a string is a legal variable name 


* returns: 0 for no, 1 for yes 


af 


{ 


char * cp; 


foriep = str; sep; cp== )f 


if ( Cisdigit( + cp) && cp== str) || ! (isalnum( « cp) || xcpB== 1») 
return 0; 

} 

return ( cp {= str );/* no empty strings, either «/ 


9.5.4 效果 如 何 
编译 并 运行 改进 后 的 程序 ， 


$ cc - o smsh3.c smsh2.c splitline.c execute. process2.c X 


controlflow.c builtin.c varlib.c 


$ 


- /smsh3 


> set 

o> day = monday 
>> temp = 75 
TE = CST6CDT 


.Y= 


cannol execute command;No such file or directory 


= get 


day = monday 
temp- 75 
TZ = CST6CDT 


> date 

Tue dul 31 11:56:59 EDT 2001 
> echo $ temp, S day 

$ temp, $ day 
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COD 已 经 可 以 正常 工作 了 

这 里 的 shell 现存 支持 变量 了 ,能 够 给 变量 赋值 .也 可 以 列 出 当前 的 变量 ,程序 甚至 会 检 
查 丰 合法 的 变量 名 ,不 会 将 这 些 名 字 作 为 程序 名 来 处 理 。 

(2) TZ 没有 传 给 Date 

从 这 里 的 例子 看 出 还 有 两 件 事 要 做 。 先 将 变量 TZ 的 值 设 为 美国 中 部 时 间 CU. S. 
central time) ,但 是 date 命令 报告 的 还 是 美国 东部 时 间 。 前 面 说 过 ,变量 TZ 是 程序 运行 环 
境 的 一 部 分 , 它 的 值 应 该 从 父 进程 传 给 子 进程 ,这 如 何 半 能 实现 呢 ? 这 里 的 shell 如 何 才能 把 
变量 放 到 环境 中 使 它 的 子 进程 能 够 访问 得 到 ? 所 以 , 接 下 来 将 讨论 环境 。 

(3) 变量 $ temp 和 $ day HERA RER RI 

刚才 的 测试 表明 这 两 个 变量 的 值 没 有 被 shell 正确 显示 ,也 就 是 说 , 当 shell 在 处 理 echo 
$ temp. $ day 时 设 有 用 变量 的 值 替换 变量 名 。 这 些 变量 是 shell 的 局 部 变量 ,echo 命令 不 
知道 这 些 变 量 的 值 ,所 以 shell 在 执行 外 部 程序 之 前 必须 进行 变量 替换 。 本 章 的 末 屁 将 会 再 
探究 这 个 问题 。 


9.6 环境 :个 性 化 设置 


大 们 襄 欢 按照 自己 的 襄 好 设置 自己 的 电脑 ,有 些 人 喜欢 用 风景 画作 桌面 ,而 其 他 一 些 人 
可 能 更 喜欢 纯色 的 桌面 ,有 些 人 喜欢 用 emacs 来 编辑 文本 ,而 有 些 人 走 欢 vis Unix 允许 用 户 
在 称 之 为 环境 Cenvironment)y 的 地 方 以 变量 的 形式 存放 这 些 设置 。 每 个 用 户 有 -- 个 惟一 的 主 
目录 ,用户 和 名 .邮件 文件 .终端 类 型 和 喜欢 用 的 编辑 器 ,很 多 个 性 化 的 设置 由 环境 中 的 变量 
记录 。 

很 多 程序 的 行为 基于 这 些 设置 ,比如 ,运行 script3, 可 以 者 到 date 根据 TZ AMA 
示 不 同 的 格式 : 


#! “bin/sh 


# script3 — shows how an environment variable is passed to commands 





* TZ is time zone, affect things like date, and ls - 1 
# 
echo "The time in Boston is" 
Ta = ESTSEDT 
export TZ # add TZ to the environment 
date # date uses the value in TZ 
echo "The time in Chicago is" 
TZ = CST6CDT 
date 
echo "The time in LA is" 
TZ = PSTAPDT 
date 


环境 不 是 shell 的 一 部 分 。 但 是 shell 包括 一 些 可 以 让 用 户 读 取 和 修改 环境 的 命令 。 一 
如 既往 , 先 瞧 具 环 境 做 些 什么 ,然后 学 习 它 是 如 何 工作 的 ,最 后 把 它 加 到 实现 的 代码 中 。 
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9.6.1 使 用 环境 


i. 列 出 环境 
env 命令 列 出 当前 所 有 环境 设置 ， 


& env 
LOGNAME = bruce 

LD LIBRARY PATH = /usr/lib-/usr/local/lib 

TERM = xterm- color 

HOSTTYPE = i386 

PATH = /bin:/usr/bin:/usr/X11R6/bin;/usr/local/bin:/home2/bruce/bin 
HOME = /home2 bruce | 
SHELL = /bin/hash 

USER = bruce 

LANGUAGE = en 

DISPLAY = :0.0 

LANG = en 

=f usr / bin/env 

SHLVL = 2 


env 是 一 个 普通 的 程序 ,而 不 是 shell ABA GS. BT E S (lcs RB ES ey B d 
用 ,比如 ,LANG 变量 被 要 显示 信息 或 消息 的 程序 使 用 ,一 个 浏览 器 可 以 用 这 个 变量 的 值 来 
决定 按 乌 的 标识 和 菜单 的 选项 ,DISPLAY 告诉 XWindows 从 哪里 打开 窗口 ， TERM 告诉 
curses(GUI 函数 库 ) 使 用 如 一 组 屏幕 控制 代码 。 

2, 更 新 环境 

(1) var= value 

通过 对 变量 赋值 就 可 以 更 新 环境 设置 。 比如 ， 如 果 浏 览 器 支持 法 语 消息 和 荣 单 ,可 以 通 
过 设置 LANG 一 fr 来 启用 法 语 。 

(2) export var 

使 用 shell 内 置 的 命令 export 向 环境 添加 新 的 变量 。 如 果 var 是 一 个 局 部 变量 ,那么 它 
将 被 添加 到 环境 里 。 如 果 var 不 存在 ,shet 会 创建 一 个 。bash 允许 通过 用 export var— 
人 P. 

. ACER PEAR 
«USES C FE BRE getenv 也 可 以 得 到 环境 变量 的 值 , 比 如 : 





# include <‘stdlib. h> 
maint ) 
[ 
char *cp = getenv("LANG"); 
if(cp!- NULL & stremp(cp , "fr") == 9) 
printf£("Bonjour\n"} ; 


else 
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printf("Hello\n™); 


9.6.2 ”什么 是 环境 以 及 它 是 如 何 工 作 的 


环境 是 每 个 程序 都 可 以 存 取 的 一 个 字符 串 数 组 ,如 图 9.6 所 示 。 每 个 数组 中 的 字符 串 都 
以 var— value 这 样 的 形式 出 现 , 数 组 的 地 址 被 存放 在 一 个 名 为 environ 的 全 局 变量 里 。 环 境 
就 是 environ 指向 的 字符 串 数组 , 读 环境 就 是 读 这 个 字符 串 数 组 ,改变 环境 就 是 改变 字符 串 、 
改变 这 个 数组 中 的 指针 或 者 将 这 个 全 局 指针 指向 其 他 数组 。 


environ 









TERM=+t1 60 


PATH-/bin:/usr/bin 







HOME-.=/users/bub 


9.6 WP ee a El NB 


1. 一 个 简单 的 他 子 
showenv. c 的 功能 就 像 命 令 env: 


/* showeny.c - shows how to read and print the environment 
xf 


Li 
extern char ` * « environ; — /* points to the array of strings */* 


maint) 
i 
int i; 
for( i = 0; environ[i] ; i-- } 
printf(" & s\n", environ i] ); 


} 


changeenv. c 改变 环境 ,然后 运行 env: 


/* changéenv.c — shows how ta change the environment 

* nate: calls "env" to display its new settings 
xf 

# include<< stdio. h > 


extern char #* environ; 
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main() 
( 
char * table[3]; 


table[0] = "TERM = vt100"; /x fill the table x/ 
table[1] = "HOME = /on/the/range"; 
table[2] - 0; 
environ - table; /* point to that table «/ 
execlp("env", "env", NULL); /* exec a program x/ 

} 

下 面 是 示例 : 

$ ./changeenv 

TERM = vt100 


HOME = /on/the/range 
$ 


仔细 看 看 程序 。 在 程序 changeenv 中 创建 一 个 字符 串 列表 ,然后 调用 execlp 来 运行 另 一 
个 程序 env。 第 二 个 程序 能 够 读 到 这 个 字符 串 列表 ,也 就 是 说 通过 某 些 方法 ,将 这 个 数组 从 
第 一 个 程序 空间 复制 到 第 二 个 程序 空间 了 。 

2. 但 是 exec 清除 了 所 有 的 数据 ! 

在 讨论 exec 系统 调用 时 候 知 道 , 对 它 的 调用 就 像 换 脑 , 用 目标 程序 的 代码 和 数据 替换 调 
用 程序 的 代码 和 数据 。 但 是 environ 指针 指向 的 数组 是 惟一 的 例外 , 当 内 核 执行 系统 调用 
execve 时 , 它 将 数组 和 字符 串 复 制 到 新 的 程序 的 数据 空间 ,如 图 9.7 所 示 。 


父 进程 





子 进 程 和 父 进程 有 | 
相同 的 代码 ,数据 | 


和 environ。 





图 9.7 environ 指向 的 数据 在 执行 exec() 时 被 复制 


在 生成 子 进程 的 过 程 中 ,观察 environ 数组 的 变化 。 可 以 看 到 ,fork 完整 地 复制 父 进程 ， 
包括 代码 和 数据 ,数据 中 包括 了 环境 。exec 清除 原来 进程 中 的 所 有 代码 和 数据 ,插入 新 程序 
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的 代码 和 数据 。 只 有 通过 参数 cxecvp 传递 的 数据 和 存储 在 环境 中 的 字符 串 可 以 从 有 旧 程序 复 
制 到 新 程序 。 

3. 子 进 程 不 能 修改 父 进程 的 环境 

于 程序 中 环境 的 设 辕 是 父 进 程 环境 的 复 本 , 子 进程 不 能 收 改 父 进 程 的 环境 。 因 为 在 进 
程 调用 fork 和 exec 时 整个 坏 境 都 被 自动 的 复制 了 ,所 以 通过 环境 来 传递 数据 比较 方便 、 
BE. 


9.6.3 在 smsh 中 增加 环境 处 理 


现在 可 以 修改 shell 程序 使 其 能 够 存 取 环境 变量 。 首先 ,shell 要 将 环境 中 的 变 晤 添加 到 
自己 的 变量 列表 里 。 然 后 shell 的 川 户 要 能 够 修改 和 添加 环境 变量 ， 

l. AH IR x* 

已 经 知道 环境 的 结构 ,而 霸 还 有 一 组 函数 向 变量 列表 添加 变量 。 当 shell 开始 运行 的 时 
候 , 环 境 中 的 变量 将 被 复制 到 自己 的 变量 列表 里 ,如 图 9.8 所 示 。 一 旦 这 些 值 被 复制 到 变量 
列表 里 ,就 能 用 set 命令 和 赋值 命令 来 查看 和 修改 这 些 变量 了 。 





environ 







VLenviron2table 







从 环境 复制 字符 串 
到 shell 的 变量 列表 
图 3.8 从 环境 复制 值 到 vartab 
2. 政变 环境 


对 smsh3 的 测试 显示 了 对 TZ 的 改动 并 没有 传 给 date, 现 在 知道 如 何 收 改 环境 变量 了 。 
修改 环境 最 简单 的 方法 是 构建 一 个 全 新 的 列表 ,这 个 列表 包含 了 shell 中 的 所 有 变量 。 然 后 
将 全 局 指针 environ 指向 这 个 列表 ,如 图 9.9 所 示 。 调 用 exec, 内 核 将 这 些 设置 复 制 到 新 的 
程序 中 。 注意 ,现在 没有 被 引用 的 环境 列表 中 依旧 存储 着 原来 的 值 ， 

3. 对 smsh 的 修改 

在 程序 流程 中 添加 两 步 , 如 图 9. 10 所 示 。 这 两 步 通过 添加 两 行 代码 来 实现 ， 
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environ 






TERN=xterm 
TZ-PST8PDT 
PATH- / bin: / sbin 







TERM=vil 00 
PAT I= bim /usr /bin 








VLtable2environ 


将 标记 为 输出 的 
shell BS fil 
到 新 建 的 字符 捉 
数 姐 中 


PATH= / bin: / sbin 


图 9.9 将 值 从 vartab 复制 到 新 的 环境 
GY stmsh4.c 中 的 setup 


void setup() 
f* 7 
* purpose; initialize shell 
* returns: nothing. calls fatal() if trouble 
x/ 
i 


extern char * * environ; 


VLenviron2table(environ); 
signal(SIGINT, SIG IGN); 
signal(SIGQUIT, SIG IGN); 


(2) execute2, c 中 的 execute; 


if ( (pid = fork()) == -1) 

perror( fork"): 
else if ( pid == 0 }{ 

environ = VLtableZenviron();/* new line */ 
Signal(SIGINT, SIG DFL); 
signal(SIGQUIT, 51G DFL); 
execvp(argv[ 0], argv); 
perror( "cannot execute command") > 


exitii); 
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smshá 
igmore signals 
env2tab 
p" 77 — get command — - exit 
| split line 
y | 

m -— —— control command? 
| I 

; . n 
| m built-in? -一 — 
| do built-in 「 -一 fork 一 一 
|# 一 —4 wait tabZenv 

| enable signals 

| | execvp 
L 一 一 一 一 一 一 i exit 





&]9.10 在 smsh 中 增加 环境 处 理 
4， 测 斌 改动 后 的 程序 


$ make snshd 

Cc - o smshd smsh4.c splitline.c execute2.c process2.C X 
controlflow.c builtin.c varlib.c 

$ ./smshá 

~date 

Tue Jul 31 09:51:03 EDT 2001 

L- TZ = PSTSPDT 

> export TZ 

[= date 

Tue Jul 31 06:51:30 PDT 2001 

> 


用 户 可 以 修改 和 增加 环境 变量 ,而 且 shell 也 会 把 这 些 新 的 值 传 给 它 运 
9,6.4 varlib.c 的 代码 


/* varlib.c 

* 

* a simple storage system to store name = value pairs 

* with facility to mark items as part of the environment 
* 

* interface; 

* WVLstore( name, value } returns 1 for Ok, 0 for no 


* VLlookup( name } returns string or NULL if not there 


x* 


VLlist() prints out current tabie 


行 的 任何 程序 了 。 
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* environment — related functions 
* VLexport( name ) adds name to list of env vars 
* VLtable2environt) copy From table to environ 


x VLenviron2table( copy from environ to table 


x details: 

* the table is stored as an array of structs that 

* contain a flag for global and a single string of 

* the form name - value. This allows EZ addition to the 
* environment. It makes searching pretty easy, as 

* long as you search for "name=" 


xf 


# include <(stdio, ho 
d include <(stdlib. h> 
# include  "varlib.h" 


# include «string. ho 


# define MAXVARS 200 /* a linked list would be nicer #/ 


struct var | 
char * str; /* name = val strings/ 
int global; /* a booleans/ 
h 
static struct var tab| MAXVARS |; /* the tablex/ 


char + );/* private methods«/ 
int); 


static char x new stringt char *, 


static struct var * find item(char * 


r 


int VLstore( char + name, char * val? 

fx 

* traverse list, if found, replace it, else add at end 
* since there is no delete, a blank one is a free one 
* return 1 if trouble, 0 if ok (like a command) 
xf 


struct var * itemp; 
char #8; 


F 


int rv = 1; 


/* find spot to put it and make new string «/ 
if (Citemp- find item(name,1))! = NULL gg 
{s= new string(name,val3)! = NULL) 


if ( itemp — >>str ) /* has a val? #/ 
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free(itemp 一 — str); /* y; remove it «/ 
itemp-—str = s; 
rv = 0; /* ok] «/ 
} 
return rv; 


Char * new string( char * name, char * val ) 


/Á* 
* returns new string of form name = value or NULL on error 
x/ 
{ 
char + retval; 


retval = malloc( strlen(name) + strlen(val) + 2); 
if ( retval t= NULL } 
sprinti(retval, "& s= &s", name, val }; 


return retval; 


i char * Vilookup( char «* name ) 
fx 
* returns value of var or empty string if not there 
xf 
{ 


struct var * itemp; 


if ( Citemp = find item(name,0)) ! - NULL) 
return itemp - —str + 1 + strlen(name); 


return ""; 


int VLexport( char * name ) 
i 
* marks a var for export, adds it if not there 
* returns 1 for no, 0 for ok 
xf 
{ 
struct var x itemp; 


int rv = 1; 


if ( Citemp = find item(name,0)) |= NULLO 
itemp- —global = 1; 
rV = 0; 


1 
Fr 


else if ( Vistore(name, "") == 1) 
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} 


rv = VLexport(name); 


return rv; 


static struct var x find item( char * name , int first hlank ) 


fs 
" 


* 


* 


searches table for an item 
returns ptr to struct or NULL if not found 
OR if (first blank) then ptr to first blank one 


xf 


int i; 
int len = strlen(name); 


char * Ss; 


for( i = 0 ; i«;MAXVARS && tab[i].str |= NULL ; i++ 3 


s = tabli]. str; 


if ( strncmp(s,name,len) == 0 && a[len] == 


return &tab| i|; 


} 

if ( i << MAXVARS && first blank } 
return &tab|i ; 

return NULL; 


void VLlist() 


fx 
* 


* 


* 


performs the shells set command 


=1 34 


Lists the contents of the variable table, marking each 


exported variable with the symbol '* ' 


x 


int i; 


for(i = 0 ; i«ZMAXVARS && tab[ i].str {= NULL ; i++ ) 


F 


! 
1 


if € tabli]. global ) 
printf(" x % s\n", tab[ i|. str); 


else 





printf(" &sVXn", tabli]. str); 


D 


int VLenviron2table(char x enw[ ]} 





+ 204 * Unix/Linux 编程 实践 教程 





* initialize the variable table by loading array of strings 
* return ] for ok, 0 for not ok 
^j 
í 
int i; 


ehar * newstring; 


for(i = 0 ; env[i] | - NULL; iss ) 
{ 
if (i == MAXVARS ) 
return Ü; 
newstring = mailec(1+ strlen(env[i]}); 
. if ( newstring == NULL ) 
return Q; 
strcpy(newstring, env[ ij}: 
tabLi].str = newstring; 
tabli].global = 1; 
} 


while( i «7 MAXVARS }{ /* Iknow we dont need this x/ 
tablil.str = NULL ; /* static globals are nulled «/ 
tab[i-- .global = 0; /x by default af 

} 

return 1; 


char ** VLtable2environ() 
/* 
* build an array of pointers suitable for making a new environment 


* note, you need to free() this when done to avoid memory leaks 


«f 
{ 
int i, /* index xf 
i, /* another index af 
n= Q; /* counter af 
char ** envtab; /* array of pointers +#/ 
/* 


* first, count the number of global variables 
x/ 


for (i = 0 ; i<cMAMVARS && tab| i|.str |= NULL ; i++ ) 
if ( tabli].global == 1) 
ntt: 


/* then, allocate space for that many variables #/ 
envtab = (char ** ) malloc( (n 1) * sizeof(char x*) 
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if ( envtab == NULL ) 
return NULL; 
/* then, load the array with pointers +r 
for(i = 0, j = 0 ; i<UMAXVARS && tab[ i].str != NULL ; i++ ) 
if ( tabl i]. global == 1) 
envtab[ j++ ] = tab[i;.str; 
envtab[j] = NULL; 


return envtab; 


9.7. 已 实现 的 shell 的 功能 


在 本 章 中 ,学 习 了 Unix shell 的 可 编程 特征 ,还 在 实现 的 shell 中 增加 了 3 个 重要 的 功 
能 :命令 行 解析 ,if .then 语句 和 变量 ,使 这 个 小 小 的 shell RERE. 下 面 是 shell 目前 的 特 
征 列表 : 











特征 是 否 支 持 有 待 改进 
命令 运行 程序 
变量 — ,set read, Svar 替换 
if if.. then else 
environ 全 部 
exit exit 
ed cd 
(1) 变量 替换 


增加 变量 替换 还 需 进一步 研究 。 在 流程 中 的 哪 一 步 将 $ X 替换 为 和 的 值 ” 注 意 下 面 的 
例子 : 


$ read x 

who am i 

$ $x 

mori.xyz.com! nobody ttyl Dec 31 13:56 
$ grep $x /etc/passwd 

grep: am: No such file or directory 

grep: i; No such file or directory 


$ 


能 够 从 这 些 输出 中 得 出 哪些 关于 shell 的 分 析 阶 段 和 变量 替换 阶段 之 间 关 系 的 信息 ? 这 
样 的 设计 有 什么 好 处 吗 ? 能 在 这 里 的 程序 中 洪 加 这 一 特性 吗 ? 
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C2) 输入 /输出 重 年 癌 
shell 允许 用 户 将 进程 的 输 人 和 输出 重 定向 到 文件 或 者 其 他 进程 。 这 是 如 何 做 到 的 呢 ? 
能 够 在 这 里 的 shell 中 增加 这 一 特征 吗 ? 将 在 下 一 章 中 学 习 输 人 /输出 重 定 向 。 





小 结 

1, 主要 内 容 

* Unix shell 运行 一 种 称 为 脚本 的 程序 。 一 个 shell 脚本 可 以 运行 程序 ,接受 用 户 输入 、 
使 用 变量 种 使 用 复杂 的 控制 逻辑 。 

* if.. then 语句 依赖 于 下 述 惯 例 ;Unix 程序 返回 0 DAR A, shell 使 用 wait 来 得 到 
程序 的 退出 状态 。 

* shell 编程 语言 包括 变量 。 这 些 变 景 看 储 字 符 串 ,它们 可 以 在 任何 命令 中 使 用 。shell 
变量 是 脚本 的 局 部 变量 。 


每 个 程序 都 从 调用 它 的 进程 中 继承 一 个 字符 串 列 表 , 这 个 列表 被 称 为 环境 。 环 境 用 
来 保存 会 话 (session) 的 全 局 设置 和 某 个 程序 的 参数 设置 ,shell 允许 用 户 查 看 和 修改 
环境 。 

2. 下 一 步 做 什么 

将 学 习 输 入 /输出 的 重 定向 。 

3. 习题 

9.1 编写 名 为 set 的 一 个 蕊 程序 或 脚本 , 试 着 用 已 经 实现 的 shell 来 运行 它们 。 会 有 什 
么 现象 ? 写 一 个 名 为 no 二 dice 的 程序 或 者 脚本 然后 试 着 执行 它 ,又 会 如 何 ? 用 
同样 的 方法 斌 试 名 为 test 的 程序 。 有 疫 有 办 法 运行 这 些 程序 呢 ? 


9.2 能 修改 process. c 和 controlflow. c Miki ze x He 4E i aS? 这 就 是 说 ， 
它 能 处 理 以 下 形式 的 输入 吗 ” 
if cmdl 
then 
if omd2 
then 
cmd3 
else 
cmd4 
fi 
else 
cmds 
ti 
RREKTORERRE ,而 不 是 像 这 里 所 显示 的 1 层 ， 需 要 更 多 的 状态 变量 吗 ? 
需要 一 个 栈 来 保存 这 些 状态 变量 吗 ” 如 果 构 造 一 个 栈 , 用 递归 的 方法 来 解决 是 不 
是 合理 ? 
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9. 


4. 


9 


3 


.4 


. 10 


-11 


varlib. c FP B2 9 ROH 1581 RE — 41 30 B He. WAAR realloc 来 
调整 原来 环境 的 大 小 呢 ? 


编程 练习 


修改 smshl. c 使 之 能 够 在 一 行 中 接受 多 个 命令 。 要 做 到 这 一 点 最 简单 的 方法 是 
修改 next cmd of. ERE EAT ER EHR. 


修改 smsh1. < 使 之 能 够 接受 带 可 选 参 数 的 exit de, WIER PETRA AE HR 
的 参数 (比如 ,exit left)。 原 来 的 流程 中 存 哪里 处 理 这 个 命令 ?需要 增加 新 的 节点 
到 原来 的 流程 中 去 吗 ? 


(ek process. c 使 之 能 支持 让 控制 语句 中 的 else 部 分 。 





ok to execute 葡 数 使 用 两 个 变量 米 雇 录 当 前 的 区 域 和 状态 。 可 以 用 一 个 有 多 个 
HERERO TER. SEPM 一 组 状态 
NEUTRAL, IF SUCCEEDED, IF FAILED, SKIPPING THEN, DOING THEN, SKIPPING ELSE, DOING 
ELSE 


修改 controlflow. c 以 使 用 这 个 单 变量 的 系统 。 


修改 smshl.c 使 之 能 接受 & 命令 结束 符 。 以 这 个 符号 结束 的 命令 将 在 后 台 运 行 。 
需要 对 next emd 做 一 些 修 改 。 


常规 的 shell 直到 读 到 最 后 GER FUA TE final 的 编号 . Ei bo SES B iD AE DUET 
个 语句 块 。 另 一 个 完 爹 不 同 的 做 法 是 将 i ESBPPIBDPSGBAEA---TELTGÓÀ 
分 的 结构 体 中 。 第 一 个 部 分 是 条 件 命 令 , 第 二 个 部 分 是 then 区 域 ,最 后 是 else 区 
域 的 命令 。 

将 整个 块 读 入 内 存 后 ,就 能 升 始 执 行 条 件 命令 ,基于 它们 的 结果 ,执行 then 区 域 或 者 
else 区 域 。 写 一 个 采用 这 个 方案 的 smsh。 你 的 解 应 该 能 接受 嵌 僵 的 RJ, 














在 你 的 shell 中 添加 while 循 坏 。 为 了 增加 这 个 功能 ,需要 把 循环 体 读 人 内 存 , 小 
A2 PITE ES memory leak), 


一 个 进程 有 很 多 属性 ,其 中 之 一 是 这 个 进程 的 当前 日 录 。Unix 的 发 明 者 写 了 个 








FERGIE EGE A shell 来 实现 。chdir 应 用 程序 有 和 什么 问题 吗 ? 在 你 的 
shell 中 添加 cd 命令 ， 


shell 支持 特殊 的 变量 来 表 东 系统 设置 。 比 如 ,变量 $$ 表示 shell 的 进程 ID. mi 
s? 表示 最 后 一 条 命令 的 退出 状态 值 。 在 你 的 程序 中 增加 这 些 变量 。 


在 标准 Unix shell 的 命令 行 中 ,可 以 将 引号 引起 来 的 部 分 作为 一 个 独立 的 参数 ， 
一 个 命令 像 vi "My Book Report" 包 含 两 个 命令 行 参 数 。 使 你 的 shell 接受 引号 ， 
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在 shell 的 哪 一 部 分 处 理 引 号 ? 考虑 命令 rm "filel. c;2”"。 就 算 你 的 程序 将 分 号 
理解 为 命令 分 隔 符 ,这 个 表达 式 还 是 应 该 被 理解 为 一 条 有 两 个 参数 的 命令 。 


42% shell 允许 用 户 通过 对 一 个 特定 的 变量 赋值 来 设置 命令 提示 符 ,在 你 的 shell 
中 增加 这 个 特征 。 在 自己 的 shell 中 定义 一 个 变量 来 表示 提示 符 。sh 和 bash 用 
变量 PS1 ,而 csh 家 族 用 变量 prompt. 
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概念 与 技巧 

* I/O 重 定 向 ; 概念 与 原因 

* 标准 输 和 人 .输出 和 标准 镜 误 的 定义 
。 重 定向 标准 IO 到 文件 

* 使 用 fork 来 为 其 他 程序 重 定向 

。 if (Pipe) 

* 创建 管道 后 调用 fork 

相关 的 系统 调用 与 沙 数 

* dup.dup2 

* pipe 


10.1 shell 编程 


下 面 这 组 命令 是 如 何 工 作 的 ? 


is > my. files 
who | sort>>userlist 


shell 是 如 和 何 告诉 程序 将 结果 输出 到 文件 而 不 是 屏幕 的 呢 ? shell 叉 是 如 何 将 一 个 进程 
的 输出 流连 接 到 另 一 个 进程 的 输入 流 的 呢 ? 标准 输入 (standard input) 这 个 术语 是 什么 
意思 ? 

本 章 将 关注 进程 他 通信 的 一 种 特殊 形式 : 输入 /输出 重 定向 各 管道 (1/O redirection and 
pipes)。 首 先 将 介绍 在 编写 shell 脚本 时 L/O 重 定向 和 管道 所 起 的 作用 。 然 后 ,本 章 将 介绍 
操作 系统 中 对 L/O 重 定 向 的 支持 。 最 后 , 写 一 个 程序 来 改变 进程 的 输 人 和 输出 流 。 
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10.2 一 个 shell 应 用 程序 : 监视 系统 用 户 


考虑 一 下 这 个 问题 : 你 的 许多 朋友 和 你 使 用 同一 个 Unix 系统 。 你 希望 编写 一 个 程序 ， 
当 其 他 用 户 登 录 系 统 或 注销 时 通知 你 。 这 样 你 就 可 以 了 解 朋友 们 的 活动 。 

可 以 写 一 个 使 用 utmp 文件 和 间隔 计数 器 的 C 程序 来 完成 任务 。 程 序 打开 utmp 文件 ， 
记录 下 用 户 列表 ,休眠 一 段 时 间 后 再 重新 扫描 此 文件 ,并 将 变化 报告 出 来 。 

一 个 更 简单 的 办 法 就 是 写 一 个 shell WA, Unix 中 有 一 个 列 出 当前 用 户 的 命令 : who. 
Unix 中 同样 包含 了 休眠 和 处 理 字符 串 列表 的 程序 。 下 面 是 一 个 Unix 的 脚本 ,用 来 报告 所 有 
的 登录 和 注销 情况 。 


Logic shell code 
get list of users(call it prev) who | sort > prev 
while true while true ; do 
sleep sleep 60 
get list of users(call it curr) who | sort — curr 
compare lists echo "logged out; " 
in prev, not in curr -> logout comm — 23 prev curr 


echo "logged in; " 


in curr, not in prev -> login comm — 13 prev curr 
make prev = curr mv curr prev 
repeat done 


此 脚本 使 用 了 Unix 系统 所 提供 的 7 个 工具 一 个 while 循环 和 1/0 重 定向 ,编写 这 个 程 
序 解决 了 问题 。 仔 细 看 一 下 这 些 程序 的 细节 ,以 及 它们 之 间 的 连接 。 

脚本 中 的 第 一 行 建立 了 一 个 在 此 脚本 运行 时 已 登录 用 户 的 列表 ,并 按 用 户 名 进行 排序 。 
who 命令 输出 用 户 列表 ,而 sort 命令 将 列表 作为 输入 读 进 ,然后 输出 一 个 排 好 序 的 列表 。 

命令 who | sort > prev 告诉 shell 同时 执行 who 和 sort, 将 who 的 输出 直接 送 到 sort 
的 输入 ,如 图 10. 1 所 示 。who 命令 并 不 一 定 要 在 sort 命令 开始 读 取 和 排序 之 前 完成 对 
utmp 文件 的 分 析 。 这 两 个 进程 以 很 小 的 时 间 间 隔 为 单位 来 调度 ,它们 和 系统 中 的 其 他 进程 
二 起 分 享 CPU 时 间 。 然 后 ,sort > prev 告诉 shell 将 sort 的 输出 送 至 prev 文件 中 。 若 此 文 
件 不 存在 , 则 创建 此 文件 ; 若 已 经 存在 , 则 替换 其 内 容 。 


who | sort > file 


图 10.1 将 who 的 输出 连结 到 sort 的 输入 
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在 休眠 一 分 钟 之 后 ,脚本 在 文件 curr PRT -ARRAPA nero e ae HE 
好 序 的 登录 记录 列表 呢 ? 使 用 Unix 的 工具 comm( 如 图 10. 2 所 示 }, 可 以 找 出 两 个 文件 中 共 
有 的 行 。 此 较 两 个 文件 可 以 得 到 三 个 子 集 ; 仅 文 件 1 有 的 行 , 仅 文件 2 有 的 行 ,两 者 共有 的 
fr. comm 命令 比较 了 两 个 排 计 序 的 列表 ,并 将 此 三 列 打印 出 来 ,这 里 的 每 一 列 代 表 一 个 子 
集 的 内 和 容 。 可 以 使 用 命令 行 选项 来 让 结果 只 出 现 其 中 的 伍 意 一 别 或 两 列 。 比 如 说 ,如 下 两 
T: 





comm — 23 prev curr 4 MRA JAZA =}; 仅 显示 prev 中 的 内 容 
comm - 13 prev curr 斗 删除 第 一 列 和 第 三 列 =) 仅 显示 curr 中 的 内 容 


生成 所 需要 的 两 个 集合 : 前 一 个 列表 中 有 而 当前 列表 中 没有 的 登录 记录 (注销 的 用 户 ), 以 及 
当前 列表 中 有 而 前 一 个 列表 中 没有 的 登录 记录 (新 登录 用 户 )。 





图 10.2 comm 比较 两 个 列表 ,输出 三 个 集合 


最 后 ,命令 mv curr prev 将 当前 列表 文件 curr 更 名 为 prev, 并 替换 原来 的 prev 文件 。 

watch. sh 脚本 体现 了 三 个 重要 的 思路 ， 

(1) shell 脚本 的 功能 一 一 与 忆 相 比 简单 易 用 ; 

(2) 软件 工具 的 灵活 性 一 一 每 一 个 工具 完成 一 项 特定 的 .通用 的 功能 ; 

(3) I/O 重 定 向 和 管道 的 使 用 和 作用 。 

EIF watch. sh 展示 了 如 何 使 用 “> " 换 作 符 来 把 文件 看 成 任意 大 小 和 结构 的 变量 。 类 似 
PRAIA CHT AVE MAA. 





x = func a(func b(y)); — /* func b MESSE func a 的 输入 +#/ 
用 shell 写 , 就 是 ， | 

prog b | prog, a > x ttf prog b 的 结果 作为 prog_a 的 输入 并 将 最 终结 果 放 人 

这 些 程序 如 何 工 作 的 ? shell 在 进程 的 连接 中 起 什么 样 的 作用 呢 ? 内 核 起 什么 作用 ” 单 
个 程序 又 起 什么 作用 ? 


10.3 标准 IO 与 重 定 向 的 若干 概念 


所 有 的 Unix VO 重 定向 部 基于 标准 数据 流 的 原理 。 考 虑 一 下 sorte 工具 是 如 何 工作 的 。 
sort 从 一 个 数据 流 中 读 取 字 节 ,再 将 结果 输出 到 另 一 个 流 中 ,同时 车 有 错误 发 生 , 则 将 错误 报 
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告 给 第 三 个 流 。 如 果 忽 略 这 些 标准 流 的 去 向 问题 ,sort 工具 的 基本 原型 就 如 图 10. 3 所 示 。 
三 个 数据 流 分 别 如 下 : 

。 标准 输入 一 一 需要 处 理 的 数据 流 

。 标准 输出 一 一 结果 数据 流 

。 标准 错误 输出 一 一 错误 消息 流 






e < 二 错误 消息 


x 
输出 数据 
图 10.3 sort 工具 将 输入 读 进 并 输出 结果 和 错误 消息 


10.3.1 概念 1: 3 个 标准 文件 描述 符 


所 有 的 Unix 工具 都 使 用 图 10. 3 中 所 示 的 三 种 流 的 模型 。 此 模型 通过 一 个 简单 的 规则 
来 实现 。 这 三 种 流 的 每 一 种 都 是 一 个 特别 的 文件 描述 符 , 其 细节 如 图 10.4 所 示 。 


标准 文件 描述 符 


0: stdin 
1: stdout 
2: stderr 











FA 10.4 3 个 特殊 的 文件 描述 符 


概念 : 所 有 的 Unix 工具 都 使 用 文件 描述 符 0、1 和 2。 
标准 输入 文件 的 描述 符 是 0, 标 准 输出 的 文件 描述 符 是 1, 而 标准 错误 输出 的 文件 描述 符 
则 是 2。Unix 假设 文件 描述 符 0,1,2 已 经 被 打开 ,可 以 分 别 进行 读 、 写 和 写 的 操作 了 。 


10.3.2 默认 的 连接 : tty 


通常 通过 shell 命令 行 运行 Unix 系统 工具 时 ,stdin stdout 和 stderr 连接 在 终端 上 。 因 
此 ,工具 从 键盘 读 取 数 据 并 且 把 输出 和 错误 消息 写 到 屏幕 。 举 例 来 说 ,如 果 输 入 sort 并 按 下 
回 车 键 ;终端 将 会 被 连接 到 sort 工具 上 。 随 便 输 入 几 行 文字 , 当 按 Ctrl-D 键 来 结束 文字 输 
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大 的 时 杠 ,sort 程序 对 输 人 进行 排序 并 将 结果 写 到 stdout, 
大 部 分 的 Unix AAR RBM CPR ERE AE A OE. OR ee Oo EBT RE 


名 ,工具 将 从 文件 读 取 数据 。 若 无 文件 名 ,程序 则 从 标准 输入 读 取 数据 ， 


10.3.3 程序 都 输出 到 stdout 


从 男 一 方面 说 ;大 包 数 程序 并 不 接收 输出 文件 和 名; 它们 总 是 将 结果 写 到 文件 描述 符 1, 并 
将 错误 消息 写 到 文件 描述 符 2?。 如 果 希 望 将 进程 的 输出 写 到 文件 或 另 一 个 进程 的 输入 去 ， 
就 必须 重 定向 相应 的 文件 描述 符 。 


10.3.4 重 定 向 I/O 的 是 shell 而 不 是 程序 


通过 使 用 输出 重 定 向 标志 ,命令 cmd filename 告诉 shell 将 文件 描述 符 1 定位 到 文件 。 
于 是 shell 就 将 文件 描述 符 与 指定 的 文件 连接 起 来 。 

程序 则 持续 不 断 地 将 数据 写 到 文件 描述 符 1 中 ,根本 没有 意识 到 数据 的 目的 地 已 经 改变 
了 。 下 面 的 程序 listargs. c 展示 了 程序 甚至 没有 看 到 命令 行 中 的 重 定向 符号 ; 


/* listargs.c 


* print the number of command line args, list the args, 
* then print a message to stderr 
*/ 


# include « stdio. h> 
main( int ac, char x av[ | ) 
1 
int i; 
printf("Number of args: $d, Args are. n", ac); 
for(is0; iac; i++) 
printf{"args[ & d; * sin", i, av[i]); 


fprintf(stderr, "This message is sent to stderr. Xn"); 


} 
程序 listargs 将 命令 行 参数 打印 到 标准 输出 注意 listargs 并 没有 打印 出 重 定 向 符号 和 
文件 名 。 


å cc listargs.c - o listargs 

$ ./listargs testing one two 
args[0] . /listargs 

args[1] testing 

args[2] one 

args[3] two 

This message is sent to stderr. 





(D sort H dd aS fei S stdout ,得 这 是 由 于 其 他 的 原因 。 
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$ ./listargs testing one two “> xyz 
This message is sent to stder. 

$ cat xyz 

args[0] ./listargs 

argse[1] testing 

args[ 2] one 

args[ 3] two 

$ ./listergs testing — zyz one two 277 oops 
$ cat xyz 

args[ 0° . /listargs 

args[ 1] testing 

args! 2] one 

args[3] two 

$ cat cops 

This message is sent ta stderr. 


这 些 例子 验证 了 关于 shell PBEM -LRBRS. RHE AE shell 并 不 将 
重 定向 标记 和 文件 名 传递 给 程序 。 

第 二 个 概念 是 重 定向 可 以 出 现在 命令 行 中 的 任何 地 方 ,并 且 在 重 定 向 标识 符 阅 转 并 不 
需要 空格 来 区 分 。 基 至 一 个 像 D listing ls 这 样 的 命令 也 是 可 以 接受 的 。 这 样 , ">" 符号 并 
不 能 终 目 命令 和 参数 , 它 只 不 过 是 一 个 附加 的 请 求 而 已 。 

最 后 一 个 概念 是 许多 版 本 的 shell 都 提供 对 重 定向 其 他 文件 描述 符 的 支持 。 例如， 
2> filename 即 重 定向 文件 描述 符 2 ,也 就 是 将 标准 错误 输出 到 给 定 的 文件 中 。 


10.3.5 理解 I/Q 重 定向 


在 watch. sh 中 可 以 看 到 ,IL/O Be ME Unix 程序 设计 中 一 个 重要 部 分 。 同 样 在 
listargs. c 中 看 到 ,是 shell, 而 非 程序 将 输入 和 输出 重 定向 的 。 

但 shell 是 如 何 重 定向 1/O 的 呢 ? 怎样 写 重 定向 LO 的 程序 呢 ? 本 章 的 工作 就 是 编写 
可 以 完成 三 个 基本 的 重 定 间 操作 的 释 序 


» whoc-userlist 将 stdout 连接 到 一 个 文件 
* sort- data 将 stdin FHA - oc (E 
* who|sort 将 stdout 连接 到 stdin 


10.3.6 概念 2:“ 最 低 可 用 文件 描述 符 [Lowest-Available — fd) " Ml 


那么 什么 是 文件 宰 述 符 呢 ? 文件 措 述 符 的 概念 非常 简单 : 它 是 一 个 数组 的 索引 号 。 每 
个 进程 都 有 其 打开 的 一 组 文件 。 这 些 打 开 的 文件 被 保持 在 -- 个 数组 中 。 文 件 措 述 符 即 为 某 
文件 在 此 数组 中 的 索引 。 图 10.5 fios T "EH ap HIC 14 XR TE (Lowest 7 Available- fd)” 
原则 。 
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Unix 经 常 给 最 低 可 用 文件 描述 符 指定 新 连接 





图 10.5 最 低 可 用 文件 描述 符 原 则 


概念 : 当 打开 文件 时 ,为 此 文件 安排 的 描述 符 总 是 此 数组 中 最 低 可 用 位 置 的 索引 。 

通过 文件 描述 符 建立 一 个 新 的 连接 就 像 在 一 条 多 路 电话 上 接收 一 个 连接 一 样 。 每 当 有 
用 户 拨 一 个 电话 号 码 ,内 部 电话 系统 为 这 人 拨号 请 求 苏 配 一 条 内 部 的 线路 号 。 在 许多 这 样 
的 系统 上 ,下 一 个 打 进来 的 电话 就 被 分 配给 最 小 可 用 的 线路 号 。 


10.3.7 两 个 概念 的 结合 


已 经 介绍 了 两 个 基本 的 概念 。 首 先 ,Unix 进程 使 用 文件 描述 符 0、1、2 作为 标准 输入 、 输 
出 和 错误 的 通道 。 其 次 , 当 进程 请 求 一 个 新 的 文件 描述 符 的 时 杠 , 系 统 内 核 将 最 低 可 用 的 文 
件 描述 符 赋 给 它 。 将 这 两 个 概念 结合 在 一 起 ,大 家 就 可 以 理解 1/O 重 定向 是 如 何 工作 的 了 ， 
也 就 可 以 自己 写 出 程序 来 完成 1/0 的 重 定向 。 


10.4 ”如 何 将 stdin 定向 到 文件 


下 面 将 详细 地 考察 ,程序 如 何 将 标准 输入 重 定向 以 至 可 以 从 文件 中 读 取 数据 。 更 加 精 
确 一 点 说 ,进程 并 不 是 从 文件 读数 据 ,而 是 从 文件 描述 符 读 数据 。 如 果 将 文件 描述 符 0 定位 
到 一 个 文件 ,那么 此 文件 就 成 为 标准 输入 的 源 。 

下 面 将 考察 三 种 将 标准 输入 定位 到 文件 的 方法 。 其 中 有 些 方法 并 不 适合 于 文件 ,但 使 
用 管道 的 时 候 ,这 些 方法 都 是 必要 的 。 


10.4.1 方法 1: close then open 


第 一 种 方法 是 close-then- open 策略 。 这 种 技术 类 似 于 挂 断 电话 释放 一 条 线路 ,然后 
再 将 电话 擒 起 从 而 得 到 另 一 条 线路 。 其 体 步 又 如 三 。 

开始 的 时 候 ,系统 中 采用 的 是 典型 的 设置 。 即 三 种 标准 流 是 被 连接 到 终端 设备 上 的 。 
输入 的 数据 流 经 过 文件 描述 符 0 而 输出 的 流 经 过 文件 描述 符 1 和 3, 如 见 图 10,6 Po. 

接 下 来 ,第 一 步 是 close(0) ,即将 标准 输入 的 连接 挂 断 。 这 里 调用 close(0) 将 标准 输入 
与 终端 设备 的 连接 切断 。 图 10.7 中 显示 了 当前 文件 描述 符 数组 中 的 第 一 个 元 素 现在 处 在 空 
闲 状 态 。 
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图 10.6 典型 的 初始 化 配置 


调用 close (0) 之 后 







图 10.7 stdin 被 关闭 


最 后 ,使 用 open(filename,O_RDONLY) 打 开 一 个 想 连 接 到 stdin 上 的 文件 。 当 前 的 最 
低 可 用 文件 描述 符 是 0, 因 此 所 打开 的 文件 将 被 连接 到 标准 输入 上 去 。 如 图 10. 8 所 示 , 任 何 
从 标准 输入 读 取 数据 的 函数 都 将 从 此 文件 中 读 入 。 





WF open ( ) 之 后 


open 调用 创建 了 一 个 到 
文件 的 连接 ， 并 建立 指向 
最 低 可 能 表 项 的 指针 。 


TT | | 





图 10.8 stdin 现在 已 经 连接 到 文件 上 了 
下 面 的 程序 即使 用 close- then - open 方法 : 


*/ stdinredirl.c 
* purpose; show how to redirect standard input by replacing file 
x descriptor 0 with a connection to a file. 


* action; reads three lines from standard input , then 


* closes fd 0, opens a disk file, then reads in 
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* three more lines from standard input 
x/ 

# include — —stdio. h> 

# include <fentl. h> 


maint) 


i 
int fd ; 
char linef100]; 


/* read and print three lines «/ 


fgets( line, 100, stdin ); printf(" $ s", line); 
fgets( line, 100, stdin ); printf(" & 5", line}; 
fgets( line, 100, stdin); printf("&s", line); 


/* redirect input x/ 


closet 0); 
fd = open("/etc/passwd", O RDONLY): 


if (fd l= D 
fprintf(stderr, "Could not open data as fd O\n"); 
exitii); 

} 


/* read and print three lines «/ 


fgets( line, 100, stdin); printf(" $ 5", line); 
fgets( line, 100, stdin ); printf("$ s", line ); 
fgets( line, 100, stdin ); printf(" € s", line); 


程序 stdinreader! M bp fed A E RIT OST HA SAR ABR MRA. SAR 
从 标准 输 大 中 读 取 并 打印 了 三 行 字符 串 。stdinreaderl 从 键盘 读 取 了 前 三 行 字符 上 IS 
行 字 符 串 则 是 从 passwd 文件 中 读 出 的 ， 


$ ./stdinredirl 

linel 

linel 

testing line2 

testing line2 

line 3 here 

line 3 here 

root; x: 0; 0; root; /root, /bin/bash 
bin; x; 1; 1, bin; /bin, 

daemon; x; 2; 2; daemon, /sbin; 


$ 
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此 程序 并 没有 什么 特别 的 地 方 , 它 仅仅 挂 断 电话 又 拨 了 一 个 新 的 号 码 而 已 。 当 连接 建 
立 起 来 后 ,就 可 以 从 标准 输入 的 一 个 新 的 源 接收 数据 了 。 


10.4.2 方法 2: open. . close. . dup. . close 


考虑 一 下 这 种 情况 : 电话 响 了 ,你 拿 起 了 楼 上 的 分 机 ,但 你 意识 到 自己 应 该 下 楼 去 接 电 
话 。 于 是 你 让 楼 下 的 人 把 电话 擒 起 ,这 样 就 有 两 个 连接 ,然后 把 楼 上 的 分 机 挂 断 ,此 时 楼 下 
的 电话 是 惟一 的 连接 了 。 这 种 情况 大 家 是 不 是 很 熟悉 ?其 实 这 种 方法 的 思路 就 是 从 楼 上 的 
电话 复制 一 个 连接 到 楼 下 ,然后 就 可 以 在 不 断 线 的 情况 下 将 楼 上 的 连接 切断 。 

如 图 10. 9 所 示 ,Unix 系统 调用 dup 建立 指向 已 经 存在 的 文件 描述 符 的 第 二 个 连接 。 这 
种 方法 需要 4 个 步骤 。 

(1) open(file) 

第 一 步 是 打开 stdin 将 要 重 定向 的 文件 。 这 个 调用 返回 一 个 文件 描述 符 , 这 个 描述 符 并 
不 是 0, 因 为 0 在 当前 已 经 被 打开 了 。 

(2) close(0) 

下 一 步 是 将 文件 描述 符 0 关闭 。 文 件 描述 符 0 现在 已 经 空闲 了 。 

(3) dup(fd) 

系统 调用 dup(fd) 将 文件 描述 符 fd 做 了 一 个 复制 。 此 次 复制 使 用 最 低 可 用 文件 描述 符 
号 。 因 此 ,获得 的 文件 描述 符 是 0。 这样 ,就 将 磁盘 文件 与 文件 描述 符 0 连接 在 一 起 了 。 

(4) close(fd) 

最 后 ,使 用 close(fd) 来 关闭 文件 的 原始 连接 ,只 留 下 文件 描述 符 0 的 连接 。 将 这 种 方法 
与 把 电话 从 一 个 分 机 转移 到 另 一 个 分 机 的 技术 做 一 个 比较 。 


fd = open("f", O RDONLY); close(0); 





B] 10.9 使 用 dup SE [8] 
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下 面 的 程序 stdinredir2. c 使 用 了 第 二 种 方法 : 


/* stdinredir2.c 


* shows two more methods for redirecting standard input 


x use # define to get one or the other 


# include — «stdio.h— 


include — «—fcntl. h> 


/* # define | CLOSE DUP /* open, close, dup, close */ 


/* # define USE DUP2 /* open, dup2, close x/ 
main() 
{ 

int fd; 

int newfd; 


char line[ 100]; 
/* read and print three lines «/ 


fgets( line, 100, stdin }; printf("& s", line 5; 
fgets( line, 100, stdin}; printf(" $& s", line}; 
fgets( line, 100, stdin ); printf(" & s", line 5; 


/* redirect input */ 


fd = open("data", O_RDONLY); /* open the disk file «/ 
# ifdef CLOSE, DUP 

close(05, 

newfd = dup({d); /* copy open fd to 0 «/ 
1f else 


newfd = dup2(fd,0); /* close 0, dup fd to 0 «/ 


i endif 


} 


if ( newfd !- 0 }{ 
fprintf(stderr, "Could not duplicate fd to O\n"); 
exitt1); f 

1 


t 


close(fd): /* close original fd «/ 
/* read and print three lines «/ 


fgetst line, 100, stdin}, printf(" & s", line); 
fgets( line, 100, stdin); printf(" *$ s", line}; 
fgets( line, 100, stdin); printf(" & s", line 5; 


介绍 上 面 提 到 的 这 个 包含 有 4 个 步骤 的 方法 的 主要 目的 是 为 了 让 大 家 了 解 dup 系统 调 
用 ,这 个 调用 在 后 面 学 习 管道 的 时 候 是 非常 重要 的 。 一 个 简单 一 点 的 方案 是 将 close COURT 
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dup(fd) 结 合 在 一 起 作为 一 个 单独 的 系统 调用 dup2。 
10.4.3 系统 调用 dup 小 结 

















dup. dupz 
目标 复制 … 个 文件 描述 答 
Lue # include <i unistd, h> 
函数 原型 newfd = dup(oldfd}; 
newfd = dupZColdfd , newfd? ; 
参数 oldid 需要 复制 的 文件 描述 符 
newfd 复制 oldfd 后 得 到 的 文件 描述 符 
返回 值 -1 发 生 错 误 
newfd 新 的 文件 描述 符 


系统 调用 dup 复制 了 文件 描述 符 oldfd。 而 dup? 将 oldfd 文件 描述 符 复制 给 newfd。 两 
个 文件 描述 符 都 指向 同一 个 打开 的 文件 。 这 两 个 调用 都 返回 新 的 文件 措 述 符 , 若 发 生 错 误 ， 
则 返回 一 1。 


10.4.4 方法 3: open. . dup2. . close 


程序 stdinredir2. c 包含 了 条 件 编译 代码 并 ifdef ,用 系统 调用 dup2(fd,0) 来 替换 close(0) 
和 dup(fd)。dup2(Corig,new) 将 文件 描述 符 old 复制 到 文件 描述 符 new, 在 此 之 前 它 先 将 文 
HER new 上 已 经 存在 的 连接 关闭 。 


10. 4.5 shell 为 其 他 程序 重 定 向 stdin 


这 些 例 子 显示 了 程序 如 何 将 标准 输入 重 定 向 到 文件 。 实 际 上 ,如 果 程 序 希 望 读 了 文件 ， 
它 直接 打开 文件 就 可 以 了 , 根本 不 需要 将 标准 输 人 重 定向 到 文件 。 这 些 例子 的 真正 意义 在 
于 说 明 一 个 程序 如 何 将 标准 输入 重 定向 到 别 的 程序 。 


10.5 ”为 其 他 程序 重 定 向 I/O: who > userlist 


当 某 用 户 输入 who> userlist. shell 运行 who 程序 ,并 将 who 的 标准 输出 重 定向 到 名 为 
userlist 的 文件 上 。 这 是 如 何 完成 的 昵 ? 

关键 之 处 就 在 于 fork 和 exec 之 间 的 时 间 间 隙 ,在 fork 执行 之 后 , 子 进程 仍然 在 运行 
shell 程序 ,并 准备 执行 exec。exec 将 替换 进程 中 运行 的 程序 ,但 它 不 会 改变 进程 的 属性 和 进 
程 中 所 有 的 连接 。 也 就 是 说 ,在 运行 过 exec 之 后 ,进程 的 用 户 ID 不 会 改变 ,其 优先 级 不 会 改 
变 ,并 且 其 文件 描述 符 也 和 运行 exec 之 前 一 样 。 注 意 ,程序 得 到 的 是 载 入 它 的 进程 所 打开 的 
文件 。 图 10. 10 展示 了 于 进程 的 输出 重 定向 。 
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子 进程 继承 了 父 进 程 指向 打开 
文件 的 指针 。 子 进程 重 定 向 标 
准 输出 : 

close(1); 

create( "Í") 

exec() ; 





被 子 进程 打开 文件 
图 10. 10 shell 为 子 进程 重 定向 其 输出 


看 一 下 如 何 使 用 这 个 原则 来 重 定 向 标准 输出 。 

1. 初始 情况 

如 图 10. 11 Bros ,进程 运行 在 用 户 空间 中 。 文 件 描述 符 1 连接 在 打开 的 文件 f 上 。 为 了 
使 这 幅 图 清楚 易 理 解 , 其 他 打开 的 文件 并 未 画 出 来 。 








图 10.11 在 调用 fork 之 间 的 进程 以 及 它 的 标准 输出 


2. 父 进 程 调用 fork 之 后 

如 图 10.12 Bros ;新 的 进程 出 现 了 。 此 进程 与 原始 进程 运行 相同 的 代码 ,但 它 知道 自己 
是 子 进程 。 此 进程 包含 了 与 父 进程 相同 的 代码 数据 和 打开 文件 的 文件 描述 符 。 因 此 文件 
描述 符 1 依然 指向 的 是 文件 f。 然 后 子 进程 调用 了 close(1) 。 


子 进程 





图 10.12 子 进程 的 标准 输出 从 父 进程 那儿 继承 而 得 


3. 在 子 进程 调用 close(1) 之 后 
如 图 10. 13 所 示 , 父 进程 并 没有 调用 close(1), 因 此 父 进程 中 的 文件 描述 符 1 仍然 指向 
f。 子 进程 调用 close(1) 之 后 ,文件 描述 符 1 变 成 了 最 低 未 用 文件 描述 符 。 子 进 程 现在 试 着 
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打开 文件 g。 





图 10.13 子 进程 可 以 关闭 其 标准 输出 


4. 在 子 进程 调用 creat("g",m) 之 后 
如 图 10. 14 所 示 ,文件 描述 符 1 被 连接 到 文件 g。 子 进程 的 标准 输出 被 重 定向 到 g。 子 
进程 然后 调用 exec 来 运行 who。 


[ol1l213|14| jJ “Solrlzlslal | 









图 10.14 子 进程 打开 一 个 新 的 文件 得 到 fa—1 


5. 在 子 进程 使 用 exec 执行 新 程序 之 后 

如 图 10.15 所 示 , 子 进程 执行 了 who 程序 。 于 是 子 进程 中 的 代码 和 数据 都 被 who 程序 
的 代码 和 数据 所 替代 了 ,然而 文件 描述 符 被 保留 下 来 。 打 开 的 文件 并 非 是 程序 的 代码 也 不 
是 数据 ,它们 属于 进程 的 属性 ,因此 exec 调用 并 不 改变 它们 。 
子 进程 
新 的 程序 


指向 打开 文件 的 指 
针 是 进程 的 一 部 分 ; 
但 此 数组 并 不 是 程 
序 中 的 数据 。 


父 进 程 






图 10.15 子 进程 运行 程序 并 将 标准 输出 重 定向 


who 命令 将 当前 用 户 列表 送 至 文件 描述 符 1。 其 实 这 组 字 节 已 经 被 写 到 文件 g PET, 
而 who 命令 却 毫 不 知晓 。 
下 面 的 程序 whotofile. c 展示 了 上 面 所 说 的 这 种 方法 : 
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/* whotofile.c 
* purpose; show how to redirect output for another program 
+ idea: fork, then in the child, redirect output, then exec 
xf 


H include <stdio.h> 


maint) 

{ 
int pid; 
int fd; 


printf( "About to run who inte a Filen"); 


/* create a new process or quit */ 

if( (pid = fork()}) == ~1){ 
perror("fork"); exit(1); 

} 

/* child does the work «/ 

if ( pid == 0 3( 


close(1); /* close, */ 
fd = creat( "userlist", 0644 ); /* then open «/ 
execlp( "who", "who", NULL }; /* and run «/ 


perror( "execlp"); 

exit(1); 
1 
/* parent waits then reports */ 
if ( pid l= 021 

wait¢ NULL) ; 


printf("Done running who. results in userlistin"); 


重 定向 到 文件 的 小 结 


共有 三 个 基本 的 概念 ,利用 它们 使 得 Unix 下 的 程序 可 以 轻易 地 将 标准 输 人 、 输 出 和 错 
误 信息 输出 连接 到 文件 ， 

COD 标准 输入 .输出 以 及 错误 输出 分 别 对 应 于 文件 描述 符 0.1.2; 

(2) 内 核 总 是 使 用 最 低 可 用 文件 描述 符 ; 

(3) 文件 描述 符 集 合 通过 exec 调用 传递 , 旦 不 会 被 改变 。 

shell 使 用 进程 通过 fork 产生 子 进 程 与 子 进程 调用 exec 之 癌 的 时 间 间 隔 米 重 定向 标准 
输入 .输出 到 文件 。 

shell 同样 支持 下 面 岂 种 形式 的 命令 : 








who > userlog 


sort <_ data 
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编写 可 以 支持 以 上 两 种 操作 的 代码 就 留 给 大 家 作为 练习 去 完成 。 


10.6 管道 编程 


现在 已 经 学 习 了 如 何 编写 程序 将 标准 输出 重 定 向 到 文件 。 下 面 将 要 讨论 如 何 使 用 管道 
来 连接 一 个 进程 的 输出 和 另 一 个 进程 的 输入 。 图 10. 16 展示 了 管道 的 工作 原理 。 管 道 是 内 
核 中 的 一 个 单 向 的 数据 通道 。 管 道 有 一 个 读 取 端 和 一 个 写 和 人 端 。 实 现 who| sort 这 样 的 操 
作 , 需 要 两 种 技巧 : 如 何 创 建 管道 ,以 及 如 何 将 标准 输入 和 输出 通过 管道 连接 起 来 。 








图 10. 16 两 个 进程 由 管道 连接 在 一 起 


10.6.1 创建 管道 
图 10. 17 所 示 即 为 一 根 管道 。 可 以 使 用 如 下 的 系统 调用 来 创建 管道 。 











pipe 
目标 创建 管道 
头 文件 # include 一 unistd. h> 
函数 原型 result = pipe(int array[2]); 
参数 array ”包含 两 个 int 类 型 数据 的 数组 
返回 什 一 1 发生 错误 


0 成 功 


pipe [1] pipe [0] 


图 10.17 管道 


调用 pipe 来 创建 管道 并 将 其 两 端 连 接 到 两 个 文件 描述 符 。array[0] 为 读数 据 端的 文件 





第 10 章 1/O 重 定向 和 管道 * 315 。 





描述 符 ,而 array[1] 则 为 写 数据 端的 文件 描述 符 。 像 一 个 打开 的 文件 的 内 部 情况 一 样 ,管道 
的 内 部 实现 隐藏 在 内 核 中 ,进程 只 能 看 见 两 个 文件 描述 符 。 

图 10. 18 显示 了 进程 创建 一 个 管道 前 后 的 状况 。 前 一 张 图 (调用 pipe 之 前 ) 显 示 了 标准 
文件 描述 符 集 。 后 一 张 图 (调用 pipe 之 后 ) 显 示 了 内 核 中 新 创建 的 管道 ,以 及 进程 到 管道 的 
两 个 连接 。 注 意 ,类 似 于 open 调用 ,pipe 调用 也 使 用 最 低 可 用 文件 描述 符 。 


调用 pipe 之 前 调用 pipe 之 后 





进程 打开 一 些 常规 的 文件 内 核 创建 管道 并 设置 文件 描述 符 
图 10. 18 进程 创建 管道 
下 面 的 程序 pipedemo. c 展示 了 如 何 创建 管道 并 使 用 管道 来 向 自 己 发 送 数 据 : 


/* pipedemo.c * Demonstrates; how to create and use a pipe 


* * Effect; creates a pipe, writes into writing 

* end, then runs around and reads from reading 

* end. A little weird, but demonstrates the idea. 
*/ 


# include <stdio. h> 
# include <unistd. h> 


main() 

{ 
int len, i, apipe [2]; /x two file descriptors +/ 
char buf [BUFSIZ]; /* for reading end x/ 


/* get a pipe */ 
if ( pipe ( apipe) == -1)( 
perror( "could not make pipe"); 
exit(1); 
} 
printf("Got a pipe! It is file descriptors; ( &d &d }\n", 
apipe[0], apipe[1]); 


/* read from stdin, write into pipe, read from pipe, print «/ 


while ( fgets(buf, BUFSIZ, stdin) )| 
len = strlen( buf ); 








« "IB... Unix/Linux 编程 实践 教程 


if ( write( apipe[1], buf, len) |= len ){ /* send */ 
perror("writing to pipe"); /* down */ 
break; /* pipe */ 

} 

for (i = 0 ; i<len ; i++ ) /* wipe */ 
buf[i] = 'X'; 

len = read( apipe[0], buf, BUFSIZ ) ; /* read «/ 

if ( len == -1){ /* from «/ 
perror( "reading from pipe"); /* pipe «/ 
break; /* pipe */ 

} 

if ( write( 1 , buf, len) != len ){ /* Send «/ 

À perror( "writing to stdout"); /* to */ 


break; /* pipe «/ 


} 


图 10, 19 显示 了 从 键盘 到 进程 ,从 进程 到 管道 ,再 从 管道 到 进程 以 及 从 进程 回 到 终端 的 
| 数据 传输 流 ; 





10.19 pipedemo. c 中 的 数据 流 


现在 已 经 学 习 了 如 何 创 建 管道 ,如 何 向 管道 中 写 数据 以 及 如 何 从 管道 中 读 取 数 据 。 实 
际 上 ,很 少 会 有 程序 用 管道 向 自己 发 送 数据 。 将 pipe 和 fork 结合 起 来 ,就 可 以 连接 两 个 不 同 
的 进程 了 。 
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10.6.2 使 用 fork 来 共享 管道 


当 进程 创建 一 个 管道 之 后 ,该 进程 就 有 了 连 向 管道 两 端的 连接 。 当 这 个 进程 调用 fork 
的 时 候 , 它 的 子 进程 也 得 到 了 这 两 个 连 向 管道 的 连接 ,如 图 10. 20 所 示 。 父 进程 和 子 进程 都 
可 以 将 数据 写 到 管道 的 写 数 据 端口 ,并 从 读数 据 端口 将 数据 读 出 ,如 图 10. 21 Bros. PE iE 
程 都 可 以 读 写 管道 ,但 是 当 一 个 进程 读 , 另 一 个 进程 写 的 时 候 ,管道 的 使 用 效率 是 最 高 的 。 


共享 管道 ， 

进程 调用 管道 ,内 核 创建 一 个 
管道 并 添加 连接 管道 端点 的 文 
件 描述 符 指针 数组 


接着 进程 调用 fork, 内核 创建 
一 个 新 进程 并 从 父 进程 复制 连 
接管 道 端点 的 文件 描述 符 指针 
数组 


两 个 进程 都 访问 管道 的 两 端 





10.20 ”共享 管道 








10. 21 进程 之 间 的 数据 流 


下 面 的 程序 pipedemo2. c 说 明了 如 何 将 pipe 和 fork 结合 起 来 ,创建 一 对 通过 管道 来 通 
信 的 进程 。 


/* pipedemo2.c * Demonstrates how pipe is duplicated in fork() 
* * Parent continues to write and read pipe, 
* but child also writes to the pipe 
x/ 

#include <stdio.h> 


+#define CHILD MESS "I want a cookie\n" 
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it define PAR MESS "testing. .Xn" 
# define copsim, x) { perror(m), exit(x); } 
main() 
{ 
int pipefd|2 |; /* the pipe  #/ 
int len; f/x for write «/ 


F 


char buf[BUFSIZ]: /* for read x/ 
int read len; 
if ( pipe( pipefd) == -13 
oopst "cannot get a pipe", 1); 
switch( fork() ){ 
case —1,; 


oops("cannot fork", 2); 


/* child writes to pipe every 5 seconds x/ 


case D; 
len = strlen(CHILD MESS); 
while ( 1 ){ 


if (write( pipefd[1], CHILD MESS, len) 1= len) 
cops("write", 3); 
sleep(5); 
} 


/* parent reads from pipe and also writes to pipe x/ 


default. 
len = strlen( PAR MESS ); 
while (1 { 


if ( write( pipefd[1], PAR MESS, len)!* len ) 
oops("write", 4); 
sleep{1); 
read len = read( pipefdl0], buf, BUFSIZ 2; 
if ( read len <= 0) 
break; 


write( 1, buf, read len); 


10.6.3 使 用 pipe.fork 以 及 exec 


本 章 已 经 介绍 了 各 种 技巧 和 患 路 来 编写 将 who 的 输出 连接 到 sort 的 输入 的 程序 。 大 家 
应 该 已 经 了 解 了 如 何 去 创建 管道 ,如 何在 进程 间 共 享 管道 ,如 何 改变 进程 的 标准 输入 以 及 如 
何 改 变 进 程 的 标准 输出 。 
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f£ 3X 8t up PRK BUS BS DO FS TE d SS EF pipe. EE 
和 名字 作 和 参数, 例如， 


pipe who sort 


pipe 1s head 


程序 的 内 在 逻辑 如 下 所 示 : 
Pipetp) 
fork() 
| 
十 一 - 一 一 -一 一 -一 一 一 一 一 一 一 十 一 一 一 - .- 一 一 一 一 一 一 一 一 -一 一 — + 
child parent 
: | 
close(p [0 j) close(pli]) 
dup2(p [1], D dup2(p[ 01,0) 
close(p [11> close(p[0]) 
exec "who" exec "sort" 
程序 代码 如 下 : 
/* pipe.c 


* Demonstrates how to create a pipeline from one process to another 
* * Takes two args, each a command, and connects 

* — av|i]s output to input of av[2; 

* * usage; pipe command! command2 

x effect, commandl | command2 

* * Limitations, commands do not take arguments 

* * uses execip() since known number of args 

* * Note, exchange child and parent and watch fun 

# include < stdio. h> 


# include —unistd. ho 
# define cops(m,x) { perror(m); exit(x); } 


maintint ac, char x # av) 


int thepipe[ 2], /* two file descriptors +#/ 
newfd, /* useful for pipes  x/ 
pid; /* and the pid «/ 


if (ac l= a}! 
fprintf(stderr, "usage, pipe cmd] emd2Xn" 
exit(1); 
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} 
if ( pipef thepipe ) == -1) /* get a pipe x / 
oops("Cannot get a pipe", 1); 


/* 
/* now we have a pipe, now lets get two processes +f 
if ( (pid = fork()) == -1) /* get a proc xf 


oops( "Cannot fork", 2); 


一 一 一 一 一 一 一 一 一 一 一 - We =-=- 一 一 af 
/* Right Here, there are two processes *j 


/* parent will read from pipe »j 


if C pid > 0){ /* parent will exec av[2] af 
close(thepipe[1]); /* parent doesmt write to pipe +f 


if ( dup2(thepipe[0], 0) == --1) 


oops "could not redirect stdin",3), 


close(thepipe[0 |); /x stdin is duped, close pipe xj 
execlp( av| 2], av[ 2], NULL); 
oops(av| 2], 4); 

D 


/* child execs av[1] and writes into pipe af 
elose(thepipe[0]); /* child doesrt read from pipe af 
if ( dupZ(thepipe[1], 1) == 12 


oopst "could not redirect stdout", 4); 


Close(thepipell]; /* stdout is duped, close pipe ef 
2,a8v[1:, NULL}; 

oops(av[1], 5); 
i 


execlpt av[17 


程序 pipe. c Hi T I shell 一 样 的 思路 和 技术 来 创建 管道 。 但 是 shell 并 不 像 pipe. c 一 样 
运行 外 部 程序 。shell 首先 创建 管道 ,然后 调用 fork 创建 两 个 新 进程， 再 将 标准 输 人 和 输出 重 
定向 到 创建 的 管道 ,最 后 骨 通 过 exec 来 执行 两 个 程序 。 


10.6.4 FARA: 管道 并 非 文 件 


管道 在 许多 方面 都 类 似 于 普通 文件 。 进 程 使 用 write Meses (XR TT read 把 数 
据 读 出 来 。 像 文件 一 样 , 管 道 是 不 带 有 任何 结构 的 字 节 序列 。 另 一 方面 ,管道 又 与 文件 不 
In] ,例如 文件 的 结尾 是 否 也 适用 手 管道 昵 ? HAMA Mesa mk 了 文件 与 管道 的 相同 
点 与 不 同 点 。 
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l. AE iÉ PE CAR 

(1) 管道 读 取 阻塞 

当 进 程 试图 从 管道 中 读数 据 时 ,进程 被 挂 起 直到 数据 被 写 进 管道 。 那 么 如 何 避 免 进程 
永 无 止境 地 等 待 下 去 呢 ? 

(2) 管道 的 读 取 结 束 标志 

当 所 有 的 写 者 美 闭 了 管道 的 写 数 据 端 时 ,试图 从 管道 读 取 数据 的 调用 返回 0, 这 意味 着 
文件 的 结束 。 

(3) 宗 个 读者 可 能 会 引起 麻烦 

管道 是 一 个 队列 。 当 进程 认 管 道中 读 取 数据 之 后 ,数据 已 经 不 存在 了 。 如 时 两 个 进程 
都 试图 对 同一 个 管道 进行 读 操 作 ,在 一 个 进程 读 取 一 些 之 后 , 另 一 个 进程 读 到 的 将 是 后 面 的 
内 容 。 它 们 读 到 的 数据 必然 是 不 完整 的 ,除非 是 个 进程 使 用 某 种 方法 来 协调 它们 对 管道 的 
i. 

2. Pi PSR 

OD 写 入 数据 阻塞 直到 管道 有 空间 去 容纳 新 的 数据 

管道 容纳 数据 的 能 力 要 比 磁盘 文件 差 的 多 。 当 进程 坛 图 对 管道 进行 写 操 作 的 时 候 ,此 
调用 将 持 起 进程 直到 管道 中 有 足够 的 空间 去 容纳 新 的 数据 。 如 果 进 程 租 写 和 人 1000 个 字 节 ， 
向 管道 中 现在 只 能 容纳 500 个 字 节 ,那么 这 个 写 入 调用 就 只 好 等 待 直到 管道 中 得 有 500 T x 
节 空 出 来 。 如 果 某 进程 试图 写 100 万 字 节 , 那 结果 会 怎样 ? 调用 会 不 会 永远 等 待 下 去 呢 ? 

(2) 写 人 必须 保证 一 个 最 小 的 抉 天 小 

POSIX 标准 规定 内 核 不 会 拆 分 小 于 512 字 节 的 块 。 而 Linux 则 保证 管道 中 可 以 存在 
4096 宇 节 的 连续 缓存 。 如 果 两 个 进程 向 管道 写 数据 ,并 且 每 一 个 进程 都 限制 其 消 入 不 大 于 
512 字 节 ,那么 这 些 消 息 者 本 会 被 内 核 拆 分 。 

(3) 若 无 读者 在 读 取 数据 , 则 写 操作 执 行 失 败 

如 果 所 有 的 读者 都 已 将 管道 的 读 取 端 关闭 ,那么 对 管道 的 写 人 调用 将 会 执行 失败 。 如 
果 在 这 种 情况 下 ,数据 还 可 以 被 接收 的 话 ,它们 会 到 哪里 去 呢 ? 为 了 避免 数据 丢失 ,内 核 采 
用 了 两 种 方法 来 通知 进程 :“ 些 时 的 写 操作 是 无 意义 的 ”。 首 先 , 肉 核 发送 SIGPIPE 消息 给 
HB. HERR it. MEMS ARE. BM write 调用 返回 一 1, 并 且 将 errno 置 为 
EPIPE, 





小 结 


1 主要 内 容 

输入 /输出 重 定向 允许 完成 特定 功能 的 程序 通过 交换 数据 来 进行 相互 协作 。 

Unix 默认 规定 程序 从 文件 描述 符 0 读 取 数据 , 写 数 据 到 文件 描述 符 1, 将 错误 信息 输 
出 到 文人 性 描述 符 ?2。 这 三 个 文件 描述 符 称 为 标准 输入、 输出 及 标准 错误 输出 。 

当 登 录 到 Unix 系统 中 ,登录 程序 设置 文件 描述 符 0.1,2。 所 有 的 连接 .文件 描述 符 
都 会 从 父 进程 传递 给 予 进 程 。 它 们 也 会 在 调用 exec 时 被 传递 。 

创建 文件 描述 符 的 系统 调用 总 是 使 用 最 低 可 用 文件 描述 符号 。 
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2. 


重 定向 标准 输入 .输出 以 及 错误 输出 意味 善 改 变 文 件 措 述 符 0,.1.2 的 连接 。 有 很 多 
种 技术 来 重 定向 标准 O. 

管道 是 内 核 中 的 一 个 数据 队列 ,其 每 一 端 连接 --- 个 文件 描述 符 。 程 序 通过 使 用 pipe 
系统 调用 创建 管道 。 

当 父 进程 调用 fork 的 时 候 , 管 道 的 两 端 都 被 复制 到 子 进程 中 。 

和 只 有 有 共同 父 进程 的 进程 之 间 才 可 以 用 管道 连接 。 

下 一 步 做 什么 





传统 的 Unix 管道 在 进程 间 进 行 数据 的 单 向 传输 。 赫 岗 个 进程 希望 来 回 传递 数据 又 该 
UA? 两 个 没有 关联 的 进程 或 两 个 进程 在 不 同 的 机 器 上 , 那 该 如 何 实现 呢 ? 在 后 面 几 章 中 ， 
将 更 加 细致 地 研究 一 下 管道 以 及 网 络 编程 ,使 用 管道 的 黑 路 可 以 轻易 地 扩展 到 套 接 字 


(socket 
3. 


18. 


10 


10. 


10. 


DEE. 
习题 
1 Ope AVE shell 将 输出 添加 到 文件 末尾 上 。shell 是 使 用 自动 添加 模式 


(CLE 5 章 ), 还 是 简单 地 寻找 文件 的 结尾 并 从 这 里 开始 写 数 据 ? 通过 shell 脚本 
设计 一 个 试验 来 回答 这 个 问题 。 


.2 在 pipe.c 中 , 父 进程 运行 着 消费 数据 的 程序 , 子 进程 运行 着 产生 数据 的 程序 。 如 





果 这 两 个 程序 的 角色 换 一 换 , 那 么 结果 有 和 何 差异 ” 将 测试 语句 ifCpid 008 if 
(pid==0) ,角色 就 可 以 被 换 过 来 。 这 将 会 导致 什么 情况 的 发 生 ? WHA? 


.3 EHE shell 支持 管道 ,需要 怎样 做 改动 ? 首先 ,如 和 何 修改 控制 流 来 识别 并 处 理 以 


管道 符号 结尾 的 命令 ? 其 次 , 若 有 许多 命令 ,它们 之 间 通 过 管道 符号 来 分 割 , 那 
SOTA ARCS PEE Be? 


.4 在 pipe. c 中 , 读 进 程 sort 关闭 了 从 父 进程 那里 复制 来 的 管道 写 数 据 端 。 fe oc fe 


BOT A E XM REHA. TRE PR A A. 


5 在 这 -和 章 的 开始 学 习 了 将 标准 输入 .输出 重 定向 到 文件 的 符号 。 知 道 重 定向 符 
号 和 文件 名 可 以 出 现在 命令 行 中 的 任意 地 方 ,并 且 重 定向 符号 和 文件 名 没有 作 
为 参数 传递 给 程序 。 

前 面 编写 的 shell 中 ,在 控制 流 的 什么 地 方 识 草 出 重 定向 的 请 求 ” 何 处 实现 这 个 
HEAL? 着 用 户 输入 set varlist ,结果 又 如 何 ?” 这 个 shell 会 允许 你 将 内 部 命令 
的 输出 重 定向 吗 ? 如 何 将 此 功能 加 入 自己 编写 的 shell 中 呢 ? 


6 GAP HA sort<cdata> data A RS Mol? 这 个 命令 的 问题 何在 ? 标准 Unix 
shell 如 何 处 理 这 一 问题 呢 ? 自己 所 写 的 shell 又 该 如 何 去 处 理 这 个 问题 呢 ? 








-7 已 经 学 习 了 如 何 将 程序 的 标准 输 和 人 输出 连接 到 一 个 文件 。 上 面 所 有 的 例子 中 都 


假设 这 里 的 文件 是 常规 磁盘 文件 。 那 么 是 否 可 以 将 输 人 输出 重 定向 到 设备 文件 
HME? 如 果 调用 了 close(0) 和 open("/dev/tty”,0) ,结果 会 如 何 呢 ? shell 是 如 何 
-来 处 理 命令 whol /dev/tty 的 ? 
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10.8 在 pipe.c 中 ;调用 了 fork # exec 函数 ,但 是 并 没有 调用 wait。 这 是 为 什么 ? 














10.9 讨论 一 下 dup 与 link 的 共同 点 与 区 别 。 
4, 编程 练习 
10.10 修改 脚本 watch. sh, 使 它 可 以 有 更 多 的 功能 。 
(D 除了 打印 所 有 骨 户 的 登录 和 注销 情况 外 ,新 的 版 本 要 求 可 以 通过 命令 行 参 
数 米 传递 一 个 包 售 要 监控 的 用 户 列 表 文 件 。 
(2) 修改 后 的 程序 仅仅 当 有 新 的 用 卢 登 录 或 注销 时 ,省 将 结果 打印 出 米 .而 不 是 
每 次 循环 都 打印 一 些 内 容 。 
(3) who 命令 除了 列 市 用 户 名 之 外 还 有 登录 时 间 .终端 和 名称 等 。rf 能 对 基 用 户 
在 哪个 终端 窗口 登录 并 不 感 兴起。 修改 程序 使 其 仅仅 当 用 户 从 登录 状态 变 
到 非 登录 状态 时 才 报 告 结果 ,而 不 去 考虑 终端 的 变化 。 
《4) 早期 的 Unix 版 本 将 数据 存储 在 当前 目 潍 下 的 文件 prev 和 curr 中 ,并 有 在 
程序 停止 运行 时 ,并 没有 对 这 两 个 文件 做 处 理 。 这 样 的 设计 有 哪些 缺点 ? 
修改 脚本 ,使 其 使 用 临时 的 文件 ,并 在 结束 运行 的 时 候 删除 它们 。 看 一 下 如 
何 使 用 shell 中 的 trap 命令 以 及 mktemp 命令 。 
10.11 修改 whotofile. c 程序 ,使 其 将 who fiy ^ ER) dir EP o 到 一 个 文件 的 末尾 ， 确 保 
在 此 文件 不 存在 时 ,程序 照样 可 以 正常 运行 。 
10.12 编写 一 个 名 为 sortfromfile, c 的 程序 ,将 sort 命令 的 输入 重 定向 ,使 其 从 文件 中 
该 和 人 数据， 文件 名 由 俞 令 行 参数 来 指定 。 
10.13 扩展 pipee 程 序 米 处 理 … 季 式 管道 。 新 版 本 的 Unix 程序 可 以 接收 三 个 程序 各 
称 作为 参数 ,并 让 它们 以 管道 的 方式 交互 数据 。 命 令 
pipe3 who sort head 
应 该 和 who|sort| head 起 到 相同 的 作用 。 
10. 14 扩展 上 题 的 程序 pipes 使 其 可 以 处 理 任意 多 的 参数 。 
10.15 tee 工具 人 允许 重 定向 数据 到 文件 并 且 将 数据 传递 给 另 -- 个 程序 。 例 如 ， 





who|tee userlist |sort “> list2 
产生 一 个 未 排序 文件 和 一 个 排序 文件 : userlist 和 list2。 传 给 tee 的 参数 是 一 个 
文件 名 ,可 以 从 参考 手册 得 到 更 详细 的 信息 。 编写 一 个 名 叫 progiee 的 程序 来 
重 定向 数据 到 程序 ,同时 通过 管道 将 数据 传递 给 另 一 个 程序 。 俩 如 命令 ， 


who|progtee mail smith sort|progtee mail - s "hello" 





root <> list? 


将 一 个 未 排序 的 列表 作为 邮件 发 给 smith ,将 排 好 序 的 文件 发 给 root, ELE — i 
排 好 序 文件 的 备份 放 到 文件 list? 中 。 
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10.16 


写 数 据 到 标准 输出 的 程序 往往 并 不 在 意 文 件 撒 述 符 是 联结 到 终端 还 是 磁盘 文 
件 。 本 章 中 似乎 暗示 进程 并 没有 方法 米 了 解 文件 描述 符 的 指向 。 其 实 这 并 不 
IE WR. FR ERAN isatty(fd) 可 以 用 来 做 判断 : 车 文件 描述 符 fd 指向 终端 , 则 函数 
返回 为 true,isatty 使 用 系统 调用 fstat。 阅 读 一 下 关于 [stat 的 介绍 ,并 有 用 它 
B— pM isaregfile fd) ,使 其 在 fd 指向 常规 碰 盘 文件 时 返回 true, 
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概念 和 技巧 

。 客户 /服务 器 模型 

用 管道 来 双向 通信 

协同 进程 Ccoroutines) 

"文件 /进程 的 相似 性 

。 什么 是 socket, HH ARE socket, 如 何 使 用 socket 
+ 网 络 服务 

* 用 socket 编写 客户 /服务 器 程序 

相关 系统 调用 和 函数 

* fdopen 


* popen 
* socket 
* bind 


listen 


accept 


connect 


11.1. 产品 和 服务 


像 制造 商 利 用 传送 带 在 工大 之 间 传 递 产品 一 样 ,Unix 程序 员 可 以 通过 管道 米 传 送 数 罕 
并 非 所 有 的 商务 过 程 都 是 像 工厂 的 生产 线 一 样 是 单 向 流动 的 , 某 些 形式 的 通信 方式 
是 双向 的 。 考 虑 一 下 农 服 干 洗 店 、 律 师 还 有 兽医 。 你 在 把 衣服 交 给 十 洗 店 ,把 宠物 送 到 兽 
医 那 边 ,或 是 将 文档 通过 e-mail 发 给 律师 之 后 ,只 需 等 待 他 们 把 处 理 好 的 东西 发 回 ,而 并 不 
需要 像 汽 车 工厂 里 的 十 人 人 邦 样 把 车 传递 给 下 一 个 荆 人 。 在 这 个 例子 中 ,需要 由 其 他 人 完 
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成 的 工作 就 称 之 为 服务 ,而 自己 则 是 服务 的 客户 。 

上 面 的 例子 跟 Unix 有 什么 关系 呢 ? Unix 中 的 管道 可 以 把 数据 从 一 个 进程 传送 到 另外 
一 个 进程 。 进 程 和 管道 不 但 类 和 似 于 二 条 生产 线 来 完成 产 草 * 还 类 似 于 一 个 大 的 服务 产业 。 
本 章 将 关注 于 进程 间 的 数据 通信 ,这 也 是 客户 /服务 器 编程 的 基础 知识 。 


11.2. 一 个 简单 的 比喻 : 饮料 机 接口 


程序 处 理 信息 就 像 人 们 消耗 饮料 一 样 。 以 图 11. 1 中 的 自动 碳酸 饮料 机 为 例 , 在 你 投 
入 硬币 , 按 下 按钮 之 后 ,饮料 就 自动 流出 。 在 此 过 程 中 ,饮料 机 内 的 分 配器 在 做 什么 工作 
WE? 在 饮料 机 内 ,应 该 有 一 桶 碳酸 水 和 男 一 捅 浓缩 的 饮料 汗水 5 当 按 下 按钮 时 ,将 激活 一 
个 配制 原材料 并 不 断 地 传送 出 产生 的 碳酸 饮料 的 过 程 。 另 一 种 方法 则 是 只 需要 将 一 瓶 预 
先 配 制 好 的 碳酸 饮料 装 到 一 个 抽水 泵 上 , 按 下 按钮 这 个 动作 就 简单 地 将 饮料 抽出 并 送 给 
外 面 的 杯子 。 


搅拌 器 





根据 需求 搅拌 来 自 存储 部 分 
图 11.1 动态 产生 或 来 自 静态 饮料 


就 像 碳酸 饮料 分 配器 一 样 ，Unix 提供 一 个 接口 来 处 理 可 能 来 自 不 同 数据 源 的 数据 ,如 
图 11.2 所 示 。 








4 种 类 型 的 数据 源 
1. 磁盘 文件 
2. 设备 
3. 管道 
4. Sockets 


2 使 用 同一 个 MO 接口 





图 11.2 一 个 接口 和 不 同 的 数据 源 


。 (1,2) 磁 盘 / 设 备 文 件 

用 open 命令 连接 ,用 read 和 write 传递 数据 。 

* (37 管道 

用 pipe 命令 创建 ,用 fork 共享 ,用 read 和 write 传递 数据 。 
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* (4)Sockets 
用 socket, listen 和 connect 连接 ,用 read 和 write 传递 数据 。 


11.3 bc: Unix 中 使 用 的 计算 器 


几乎 每 个 版 本 的 Unix 都 包含 bc 计算 器 ,尽管 这 些 计算 器 的 版 本 有 些 差异 。be 计算 器 
中 包含 变量 ,循环 和 函数 的 功能 ,并 如 在 第 1 章 中 所 看 到 的 那样 支持 对 长 整数 的 处 理 。 


$ bc 

17^123 

22142024630120207359320573764236957523345603216987331 73224049701\ 
6947292822996637496750906355872025391 170927994632063938187990037\ 
220685580536286573569713 


每 行 末 尾 的 反 斜 线 表 示 数 字 行 的 继续 。 

1. bc 并 不 是 一 个 计算 器 

一 个 计算 器 程序 分 析 它 的 输入 ,执行 操作 ,然后 将 输出 打印 出 来 。 大 部 分 版 本 的 ,be 程序 
都 只 分 析 输 入 ,并 不 执行 操作 了?。 其 实 ,bc 在 内 部 启动 了 dc 计算 器 程序 ,并 通过 管道 与 其 进 
行 通信 。dc 是 一 个 基于 栈 的 计算 器 , 它 需 要 用 户 在 指定 具体 的 操作 符 之 前 , 先 输入 所 要 操作 
的 数据 。 例 如 ,用 户 输入 2 2 十 来 代表 2 加 2 dE, 

11.3 SR T bc 如 何 来 处 理 2 十 2 的 过 程 : 用 户 输入 2 十 2, 然 后 按 回 车 。bc 从 标准 输 
入 读 取 该 表达 式 , 分 析出 数据 和 操作 符 , 接 下 来 把 一 系列 的 命令 “2”,“2”,“ 十 ”和 p 传 给 de, 
dc 则 将 数据 入 栈 ,运行 加 操作 ,最 后 把 栈 顶 的 数值 送 到 标准 输出 。 





图 11.3 bc 和 de 作为 协同 进程 


be 从 连接 到 de 标准 输出 的 管道 上 读 取 结 果 , 再 把 结果 转发 给 用 户 。 这 样 的 话 ,bc 甚至 
都 不 需要 持 有 变量 。 如 果 用 户 输 入 x— 24-2, bc 告诉 de 执行 该 操作 并 且 把 结果 存 到 寄存 器 
x 中。 命令 bc-e 可 以 显示 分 析 器 传 给 计算 器 的 数据 5 BEE GNU 版 本 的 bc 也 是 把 用 户 的 
输入 转换 成 基于 栈 的 后 缀 表达 式 。 

2. 从 bc 方法 中 得 到 的 思想 

(1) 客户 /服务 器 模型 

bc/dc 程序 对 是 客户 /服务 器 模型 程序 设计 的 一 一 个 实例 . de 提供 服务 : 计算 。dc 所 识别 
的 语言 是 众所周知 的 逆 波 兰 表示 法 。bc 和 de 之 间 通 过 标准 输入 stdin 和 标准 输出 stdout 进 
行 通 信 。be 提供 用 户 界面 ,并 使 用 dc 提供 的 服务 。 这 里 bc 被 称 为 de 的 客户 。 


O GNU 版 本 的 bc 是 执行 计算 操作 的 。 








。328 * Unix/Linux 编程 实践 教程 





这 两 个 部 分 是 根本 上 独立 的 程序 。 可 以 使 用 不 同 版 本 的 dc, 这 并 不 影响 bc 正常 工作 。 
类 似 地 ,可 以 编写 一 个 图 形 界 面 的 be, 而 仍 用 de 作为 计算 引擎 。 甚至 可 以 用 这 样 一 个 程序 
来 替换 de, 该 程序 先 分 析 dc 所 识别 的 语言 ,然后 把 它 所 要 做 的 工作 传 给 可 能 位 于 另 一 台 更 
高 速 计算 机 上 的 程序 。 

(2) 双向 通信 

客户 /服务 器 模型 不 同 于 生产 线 的 数据 处 理 模型 , 它 要 求 一 个 进程 既 跟 另 一 个 进程 的 标 
准 输入 也 要 和 它 的 标准 输出 进行 通信 。 传 统 的 Unix 的 管道 只 是 单方 向 地 传送 数据 了 ,图 11. 
3 给 出 了 bc 和 dc 之 间 的 两 个 管道 ,其 中 上 面 的 管道 把 一 些 计 算命 令 传 给 dc 的 标准 输入 ,下 
面 的 管道 把 dc 的 标准 输出 传 给 bc。 

(3) 永久 性 服务 

bc 只 是 让 单一 的 dc 进程 处 于 运行 状态 ,这 就 不 同 于 shell 程序 ,这 种 程序 中 的 每 个 用 户 命 
令 都 创建 一 个 新 的 进程 。bc 程序 持续 不 断 地 和 dc 的 同一 个 实例 进行 通信 ,把 用 户 的 输入 转换 
成 命令 传 给 dc。 他 们 之 间 的 关系 并 不 同 于 标准 函数 中 所 使 用 的 调用 返回 机 制 。 

bc/dc 对 被 称 之 为 协同 进程 (coroutines) 以 用 来 区 别 于 子 程序 (subroutines) 。 两 个 程序 
都 持续 运行 , 当 其 中 的 一 个 程序 完成 自己 的 工作 后 将 把 控制 权 传 给 舅 一 个 程序 。'bc 的 任务 
是 分 析 输 入 及 打印 ,而 dc 则 负责 计算 。 


11.3.1 45 bc: pipe、fork、dup、exec 


图 11.4 显示 了 内 核 将 用 户 连接 到 bc 并 将 bc 连接 到 ;de 的 数据 连接 。 这 里 以 该 图 作为 
编写 下 面 代码 的 指南 。 

(1) 创建 两 个 管道 。 

(2) 创建 一 个 进程 来 运行 dc。 

(3) 在 新 创建 的 进程 中 , 重 定 问 标准 输入 和 标准 输出 到 管道 ,然后 运行 exec dc。 

(4) 在 父 进程 中 , 读 取 并 分 析 用 户 的 输入 ,将 命令 传 给 “dc, dc 读 取 响应 ,并 把 响应 传 给 
用 户 。 





图 11.4 bc、dc 和 内 核 


D 有 一 些 管 道 也 能 双向 传输 数据 ( 见 小 结 中 编程 练习 11. 11) 。 
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FP mi dé tinybe. c 的 源 程 序 ,这 是 一 个 简单 版 本 的 be. FH sscanf 分 析 输 入 ,并 通过 两 个 管 
道 与 de 通信 ，。 


fen tinyhe. g * a tiny calculator that uses dc to do its work 
xe * demonstrates bidirectional pipes 
xa * input looks like number op number which 
** tinybc converts into number Xn number Xn op \n p 
xo and passes result back to stdout 
xx 
xe + 一 一 - 一 一 一 一 -一 一 一 + +t 一 一 一 ~ 一 一 一 一 一 + 
* stdin 0 I-- pipetodc = 二 = 一 人 > | 
ax | tinybc | i dc 一 | 
Par stdout «1 <== pipefromde ==<7 | 
xa 4------ --- 一 + 1 一 一 一 一 一 一 一 一 一 一 * 
He 
*x* * program outline 
x a. get two pipes 
aK b. fork (get another process) 
*x c. in the dc - to- be process, 
x connect stdin and out to pipes 
ae then execl dc 
ee d. in the tinybc - process, no plumbing to do 
Hx just talk to human via normal i/o 
nx and send stuff via pipe 
xx e. then close pipe and de dies 
xc * note. does not handle multiline answers 
x xf 


D 


diinclude  «stdio.h7 


ft define oops(m,x) ! perrortm) ; exit(x); } 
maing} 
i 
int pid, tode[2], fromdc[2]; /* equipment */ 


/* make two pipes «/ 


if ( pipe(todc) == -1 || pipe(fromdc) == -1) 
oops( "pipe failed”, 1); 


/* get a process for user interface x/ 


if ( (pid = fork()) =- -1) 


oops( "cannot fork", 2); 
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if ( pid == 0) /* child is dc «/ 
be dc(todc, fromdc); 

else | 
be bei todo, fromdc); /* parent is ui «/ 
wait(NULIL; /* wait for child #/ 


-一 


be dc(int in[2], int eat[2]) 

fx 
* set up stdin and stdout, then execl dc 
af 


D 


/* setup stdin from pipein «/ 


if (dup2(in[01,0) == -1) /* copy read end to D «/ 
oopsC"de, cannot redirect stdin",3); 

close(in[0 D; /* moved to fd 0 «/ 

elose(in[1]); /* won't write here »/ 


/* setup stdout to pipeout x/ 


if ( dup2(out[1], 1) == -1) /* dupe write end to 1 x/ 
Gops("dc, cannot redirect stdout",4); 

cleseCoutI 1]; /* moved to fd 1 x/ 

close(out| 0]; /* won't read from here x/ 


/* now execl de with the - option x/ 
execint "de", "de", "no "a NULL Hr 
copst"Cannot run dc", 52; 

} 


be bc(int todc[2], int fromde[2]) 


ix 
* read From stdin and convert inLo to REN, send down pipe 
* then read from other pipe and print to user 
* Uses fdopen() to convert a file descriptor to a stream 
+f 
i 
int numl, mum? - 
char operation{ BUFSIZ], message[BUFSIZ], x fgets(); 
FILE *fpout, *fpin, * fdopen(); 
/* setup «/ 
close(todc[0]); /* won't read from pipe to dc «/ 


close(fromdc[1)); /* won't write to pipe from dc x/ 
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fpout = fdopent todc[]],"w" 5; /* convert file desc- #/ 
fpin = fdopen( fromde[0], "r" 2; /* riptors to streams «/ 
if ( fpout == NULL ;| fpin == NULL) 

fatal( "Error convering pipes to streams"); 
/* main loop x/ 
while ( printf("tinybe, "), fgets(message,BUFSIZ,stdin) ! = 

NULL ?1 


/* parse input «/ 

if ( sscanfímessage," £d € [ - + s/^]&d", 
&numi,operation,&num2)! = 3)| 
printf( "syntax errorin") ; 


continue; 


if ( fprintf( fpout , "$ din & dns cXnpn", nmt, num2, 
* operation ) == EOF > 
fatal( "Error writing"); 
fflush( fpout 5); 
if ( fgets( message, BÜUFSIZ, fpin ) == NULL) 
break; 

printf("$ d tc td = *s", numi, « operation , num2, message); 
} 
tfclose(fpout); /* close pipe */ 
felose(fpin); /* dc will see EOF «/ 


t 


fatal( char x mess[ |? 

1 
fprintf(stderr, "Error; 5 sin", mess); 
exit(1); 


下 面 是 tinybe 的 运行 过 程 : 


$ ec tinybc.c -o tinybc ; ./tinybc 
tinybc: 2 * Z 

2*1 2-4 

tinybc, 55^5 

5555 = 5032B4375 

tinybc: 


仔细 观察 程序 的 输出 ,看 一 看 哪 一 部 分 是 来 自 于 娜 个 程序 。tinybc 产生 了 提示 符 并 再 一 
次 显示 出 算术 表达 式 。 计 算 的 结果 是 电 de 产生 的 字符 串 ,tinybc 只 是 从 管道 中 读 取 该 字符 
串 然后 把 它 传 给 输出 。 
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11.3.2 对 协同 进程 的 讨论 


其 他 的 一 些 Unix 工具 是 否 也 能 被 看 成 协同 进程 呢 ? sort 工具 能 否 被 当做 协同 进程 使 
Hi? 答案 是 否定 的 。 在 sort 产生 输出 之 前 , 它 读 到 文件 中 所 有 的 数据 。 通 过 管道 来 传送 文 
忻 结尾 标志 的 惟一 途径 是 将 写 数 据 端 关闭 。 一 旦 关闭 了 写 的 进程 ,就 不 能 再 传送 其 他 需要 
排序 的 数据 了 。 

从 另 一 方面 齐 ,dc 是 逐 行 处 理 数据 和 命令 的 。 与 de 的 交互 很 简单 并 可 预测 。 当 需要 de FT 
印 一 个 数据 时 ,将 会 得 到 一 行文 本 。 当 需要 dc 把 数据 压 栈 时 ,不 会 有 响应 被 传 蔬 。 

一 个 客户 /服务 器 模型 程序 此 成 为 协同 系统 必须 有 明确 指明 消息 结束 的 方法 ,并 且 程 序 
必须 使 用 简单 并 可 预测 的 请 求 和 应 答 。 


11.3.3 fdopen: 让 文件 描述 符 像 文件 一 样 使 用 


在 tinybc. c 'P ft FH T PE eR & fdopen, fdopen 与 fopen 类 似 , 返 回 一 个 FILE « 类 型 的 
值 , 不 同 的 是 此 辐 数 以 文件 描述 符 而 非 文 件 作为 参数 。 

使 用 fopen 的 时 候 , 将 文件 名 作为 参数 传 给 它 。fopen 可 以 打开 设备 文件 也 可 以 打开 常 
规 的 磁盘 文件 。 如 只 知道 文件 描述 符 而 不 清楚 文件 名 的 时 候 可 以 使 用 fdopen 命令 。 例 如 在 
管道 的 例子 中 ,把 一 个 通 向 管道 的 连接 转换 成 FILE * 类 型 值 之 后 ,就 可 以 盘 用 标准 缓存 的 
1/0 操作 米 对 其 进行 操作 了 。 注 意 tinybe. c 是 如 何 使 用 fprintf 和 fgets 来 通过 管道 和 de 进 
行 通信 的 。 

使 用 fdopen 使 得 对 远 端 的 进程 的 处 理 就 如 同 处 理 常规 文件 一 样 。 下 一 节 将 剖析 popen 
软 数 ,此 函数 通过 封装 pipe. fork, dup 和 exec 等 系统 调用 使 得 对 程序 和 文件 的 操作 变 成 了 
~~ ELS, 

















11.4 popen: 让 进程 看 似 文 件 
这 一 节 将 继续 学 习 一 个 程序 如 何 通 过 和 另外 -- 个 进程 通信 来 得 到 服务 。 本 节 还 将 前 析 
popen JE 8X BAF popen 及 其 工作 原理 ,最 后 给 出 popen 实现 版 本 。 
11.4.1 popen 的 功能 
fopen 打开 一 个 指向 文件 的 带 组 存 的 连接 ， 


FILE* fp; /* a pointer to a struct «/ 

fp = fopen("filel","r"); /* args are filename,connection type */ 
c= getc(fp); /* read char by char «/ 
fgets(buf,len,fp); /* line by line */ 

fscanf(fp,"&d'*d5 s" &x,&y,x);  /* token by token x/ 

fclose(fp); /* close when done */ 


fopen 需要 两 个 字符 皖 变 量 作为 参数 : CP ALE BE2 0 CAB Y "rw" ae), popen 
看 上 去 跟 fopen 很 类 似 。popen 打开 一 个 指向 进程 的 带 缓 吕 的 连接 : 
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FILE* fp; /* same type of struct x/ 

fp = popen( "1s", "r") /* args are program name, connection type x/ 
fgets(buf,len,fp); /* exactly the same functions */ 
pclose(fp); /* close when done */ 


图 11.5 显示 了 popen 和 fopen 之 间 的 相似 性 。 两 者 使 用 相同 的 语法 格式 ,并 具有 相同 
的 返回 值 类 型 。popen 的 第 一 个 参数 是 要 打开 的 命令 的 名 称 ; 它 可 以 是 任意 的 shell 命令 。 
第 二 个 参数 可 以 是 “r" 或 cw”, 但 决 不 会 是 “an 


= i TS = » 
fopen ("file", "r") : 


图 11.5 fopen 和 popen 


下 面 的 程序 将 who| sort 作为 数据 源 ,通过 popen 来 获得 当前 用 户 排序 列表 ; 


/* popendemo. c 
* demonstrates how to open a program for standard i/o 
* important points; 
x 1. popen() returns a FILE * , just like fopen() 
* 2. the FILE * it returns can be read/written 
* with all the standard functions 
* 3. you need to use pclose() when done 
«/ 


#include <stdio.h> 
# include <stdlib.h> 


int main() 
{ 
FILE * fp; 
char buf[ 100]; 
int i = 0; 
fp = popen( "who|sort", "r" ); /* open the command x/ 


while ( fgets( buf, 100, fp) != NULL) /x read from command */ 
printf("%3d %s", i++, buf); /x print data */ 


pclose( fp ); /* IMPORTANT! x/ 
return 0; 
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第 二 个 例子 将 popen 和 邮件 程序 相连 接 , 用 来 提示 用 户 一 些 系统 故障 : 


/* popen ex3.c 
* shows how to use popen to write to & process that 
* reads from stdin. This program writes email to 
ae two users. Note how easy it is to use fprintf 
* to format the data to send. 


: 
ee 


# include  «stdio. h= 


main) 


{ 
FILE * fp; 


fp = popen( "mail admin backup", "w" 5; 
fprintf( fp, "Error with backup!! \n" 5; 


pelose( fp); 
, 


pclose 命令 是 必须 的 。 

当 和 完成 对 popen 所 打开 连接 的 读 写 后 ,必须 使 用 pelose 关闭 连接 ,而 不 能 用 fclose。 进 
程 在 产后 之 后 必须 等 待 进出 运行 ,否则 它 将 成 为 僵尸 进程 (zombie)。 而 pelose 中 调用 了 
wait 函数 来 等 待 进程 的 结束 。 


11.4.2 实现 popen: 使 用 fdopen 命令 


popen 是 如 何 二 作 的 ?如何 来 实现 它 ”popen 运行 了 一 个 程序 并 返回 指向 该 程序 标准 
输 人 或 标准 输出 的 连接 。 

这 里 需要 一 个 新 的 进程 来 运行 程序 ,所 以 要 用 到 fork 命令 。 需 要 一 个 指向 该 进程 的 连 
接 , 因 此 需要 使 用 管道 。 并 日 使 用 doper 命令 将 一 个 文件 描述 符 定向 到 缓冲 流 中 。 最 后 ,在 
该 进程 中 要 能 够 运行 任何 shell 命令 ,所 以 要 用 到 exec。 但 是 会 运行 什么 程序 呢 ? 惟一 能 够 
运行 任意 shell 命令 的 程序 是 shell 本 身 即 /bin/sh。 为 了 使 程序 员 可 以 方便 的 使 用 ,sh 支持 
-< 选项 ,用 以 告诉 shell 执行 革命 令 然后 退出 ， 例 如 ; 





sh -c "who|sort" 





告诉 sh 执行 命令 行 who|sort, 如 图 11.6 ro. 
这 里 合并 了 pipe fork, dup? 和 exec 等 系统 调用 ,其 流程 如 下 ; 


pipe(p) 
fork() 


close(p[1 |); close(p[0]); 
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fp = fdopen(p[0],"r"); dup(p[ 1],1); 
return fp; close(p[1]); 


exec("/bin/sh", "sh", " — c" , cmd, NULL) ; 





图 11.6 从 shell 命令 中 读 取 


下 面 的 程序 popen. c 是 上 述 流程 的 一 个 实现 : 


/* popen.c — a version of the Unix popen() library function 
* FILE * popen( char * command, char * mode ) 


x command is a regular shell command 

x mode is "r" or "w" 

x returns a stream attached to the command, or NULL 
* execls "sh" "- c" command 

x todo: what about signal handling for child process? 

x/ 


# include <stdio.h> 
# include <signal.h> 


+ define READ 0 
# define WRITE 1 


FILE * popen(const char * command, const char * mode) 
{ 


int pfp[2], pid; /* the pipe and the process */ 
FILE * fdopen(), * fp; /* fdopen makes a fd a stream */ 
int parent end, child end; /* of pipe */ 

if ( * mode == 'r' ){ /* figure out direction x/ 


parent end - READ; 

child end - WRITE ; 
) else if ( * node == 'w«' ){ 

parent end - WRITE; 

child end = READ ; 
) else return NULL ; 


if ( pipe(pfp == -1) /* get a pipe x/ 
return NULL; 
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if ( (pid = forkO) == - 104 and a process »/ 
closetpfp[ 0]? ; /* or dispose of pipe */ 
closetpfp[1]); 
return NULL; 

} 

fe 一 一 一 一 一 一 一 一 一 --- parent code here -一 rr 一 r 





/* need to close one end and fdopen other end «/ 


if ( pid > 0 5 
if (closet pfp[child end] ) -+ -19 
return NULL; 


return fdopen( pfp[parent end] , mode) ;/* same mode «/ 


A 一 一 一 一 一 一 一 一 -一 一 一 一 一 一 child code here 一 -一 D om xf 


/* need to redirect stdin or stdout then exec the cmd x/ 


if ( close(pfp|parent end) == -1 }/* close the other end +/ 
exit(1); /* do NOT return */ 

if ( dup2(pfp[child end], child end) == -1) 
exit(1); 

if ( close(pfp[child end] == -1) f/x done with this one +” 
exit(1); 


/* all set to run cmd */ 
execl( "/bin/sh", "sh", "— c", command, NULL ); 
exit(1)5; 
} 


该 版 本 的 popen 对 售 导 不 做 任何 处 埋 。 这 是 不 是 有 问题 ? 
11.4.3 访问 数据 ; 文件 .应 用 程序 接口 {API) 和 服务 器 


[open 从 文件 获得 数据 ,而 popen 从 进程 获得 数据 .这 里 主要 关注 一 下 数据 访问 的 普遍 
问题 并 对 三 种 实现 方法 进行 比较 。 将 以 获取 登录 系统 的 用 户 列表 为 例 来 比较 三 种 访问 数据 
的 方法 。 

* 方法 1: 从 文件 获取 数据 

可 以 通过 读 取 文件 来 获取 数据 。 第 2 章 所 写 的 who 程序 就 是 从 ump 文件 中 读 取 数据 的 。 
基于 文件 的 信息 服务 并 不 是 很 完美 。 客 户 端 程序 依赖 于 特定 的 文 作 格 式 和 结构 体 中 的 特定 成 
员 名 称 。 下 面 的 Linux 头 文件 定义 中 ump 结构 体 的 几 行 代码 清楚 地 展示 了 这 一 点 。 


/*Backwards compatibility hacks. x/ 


H define ut name ut user 
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。 方 法 2: 从 函数 获取 数据 

可 以 通过 调用 函数 来 得 到 数据 。 一 个 库 函数 用 标准 的 函数 接口 来 封装 数据 的 格式 和 
位 置 。Unix 提供 了 读 取 utmp 文件 的 函数 接口 。getutent 的 帮助 信息 描述 了 读 取 utmp 数 
据 库 函数 的 细节 。 这 样 的 话 , 就 算 底层 的 存储 结构 变化 了 ,使 用 这 个 接口 的 程序 仍 能 正常 
TE 

使 用 基于 应 用 程序 接口 CAPI) 的 信息 服务 也 并 不 一 定 是 最 好 的 方法 。 有 两 种 方法 可 
以 使 用 库 函 数 。 一 个 程序 可 以 使 用 静态 连接 来 包含 实际 的 函数 代码 。 但 是 这 些 函 数 有 可 
能 包含 的 并 不 是 正确 的 文件 名 或 文件 格式 。 另 一 方面 ,一 个 程序 可 以 调用 共享 库 中 的 函 
数 , 但 是 这 些 共享 库 也 并 不 是 安装 在 所 有 的 系统 上 ,或 者 其 版 本 并 不 是 程序 所 要 使 用 的 
版 本 。 

。 方法 3: 从 进程 获取 数据 

第 三 种 方法 是 从 进程 中 读 取 数据 。bc/dc 和 popen 例子 显示 了 如 何 创建 一 个 进程 到 另 
外 一 个 进程 的 连接 。 一 个 要 得 到 用 户 列表 的 程序 可 以 使 用 popen 来 建立 与 who 程序 的 连 
接 。 由 who 命令 来 负责 使 用 正确 的 文件 名 和 文件 格式 以 及 正确 的 库 函 数 ,而 不 是 你 的 程序 。 

调用 独立 的 程序 获得 数据 还 有 其 他 的 好 处 。 服 务 器 程序 可 以 使 用 任何 程序 设计 语言 编 
写 ; shell 脚本 、C、Java 或 是 Perl 都 可 以 。- 以 独立 程序 的 方式 实现 系统 服务 的 最 大 好 处 是 客 
户 端 程序 和 服务 器 端 程序 可 以 运行 在 不 同 的 机 器 上 。 所 有 要 做 的 只 是 和 不 同 机 器 上 的 一 个 
进程 相连 接 。 


11.5 socket: 与 远 端 进程 相连 


管道 使 得 进程 向 其 他 进程 发 送 数据 就 像 向 文件 发 送 数据 一 样 容易 ,但 是 管道 具有 两 
个 重大 的 缺陷 。 管 道 在 一 个 进程 中 被 创建 ,通过 fork 来 实现 共享 。 因此 ,管道 只 能 连接 相 
关 的 进程 ,也 只 能 连接 同一 台 主 机 上 的 进程 。Unix 提供 了 另外 一 种 进程 间 的 通信 机 制 
一 一 Socket。 

socket 允许 在 不 相关 的 进程 间 创建 类 似 管道 的 连接 ,甚至 可 以 通过 socket 连接 其 他 主 
机 上 的 进程 (如 图 11.7 所 示 )。 本 节 将 学 习 socket 的 基础 知识 ,理解 如 何 用 socket 连接 不 同 
主机 上 的 客户 端 和 服务 器 端 。 其 思想 就 跟 打 电 话 查 询 当 地 时 间 一 样 简 单 。 


进程 进程 


网 络 连接 


11.7 连接 到 远 端 的 进程 
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11.5.1 类 比 :“ 电 话 中 传 来 声音 : 现在 时 间 是 ……” 


许多 城市 都 设 有 提供 时 间 服 务 的 电话 号 码 。 只 要 拨打 该 号 码 , 机 器 将 负责 告诉 你 该 城 
市 的 时 间 。 它 是 如 何 工作 的 呢 ? 如 果 想 建立 自己 的 时 间 服 务 ,该 如 何 做 呢 ? 可 以 采用 图 11. 
8 中 所 描述 的 比较 简单 的 方法 。 你 坐 在 办 公 室 里 ,将 一 个 钟 挂 在 墙 上 来 扮演 提供 时 间 服 务 的 
服务 器 。 你 所 要 遵循 的 步骤 和 Unix 中 基于 socket 建立 时 间 服 务 器 的 步骤 完全 一 致 。 下 面 ， 
将 详细 讨论 这 些 步骤 。 








建立 服务 
找到 电话 等 待 请 求 - 
请 求 时 间 -~ > 接收 请 求 
获得 数据 发 送 数据 
挂 断 挂 断 
图 11.8 时 间 服 务 
l. 建立 服务 及 与 服务 相关 的 操作 
一 旦 买好 并 安装 了 你 自己 的 时 钟 ,如 何 建立 和 操作 时 间 服 务 器 呢 ? 
(1) 建立 服务 
建立 服务 包含 以 下 3 PER. 
。 获取 一 根 电话 线 


首先 ,需要 一 根 接 自 公 用 电话 网 上 的 电话 线 来 连接 办 公 桌 旁 墙 上 的 插座 。 该 电话 线 和 
插座 使 你 可 以 连接 到 电话 网 上 , 接 下 来 外 面 的 呼叫 可 以 被 传送 到 你 的 办 公 桌 。 这 里 的 插座 
通常 被 称 为 通信 端点 (endpoint of communication) 。 下 一 次 如 果 需 要 在 家 里 安装 电话 线 , 可 
以 向 电话 局 申请 安装 一 个 通信 端点 。 

。 为 电话 线 申 请 号 码 

客户 端 需要 通过 呼叫 一 个 电话 号 码 连接 到 你 的 通信 端点 。 电 话 网 络 以 电话 号 码 来 区 分 
每 个 墙 上 的 插座 。 从 这 个 类 比 本 身 考 虑 ,设想 你 是 在 一 个 大 的 商务 系统 中 ,除了 时 间 服 务 以 
外 还 需 提 供 其 他 的 服务 。 因 此 ,每 个 插座 要 以 电话 号 码 附 加 二 个 分 机 号 码 来 标识 。 

例如 : 你 的 号 码 可 能 是 617 一 999 一 1234, 分 机 号 码 是 8080 ,电话 号 码 标识 了 你 的 办 公 室 
所 在 的 大 楼 的 号 码 ,扩展 号 码 8080 标识 了 该 楼 中 每 个 具体 的 电话 。 一 个 号 码 来 标识 大 楼 ,一 
个 分 机 号 码 来 标识 你 的 服务 ,这 是 一 个 重要 的 机 制 。 

。 处 理 接 人 电话 

你 可 能 使 用 的 是 无 来 电 显示 的 电话 。 你 的 服务 不 需要 上 述 类 型 的 电话 服务 。 但 必须 通 
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5m RU ER LR B E PRI RE A], PR OE AP PA HL — 7 
消息 来 提示 拨打 省 对 你 来 说 他 们 呼叫 的 重要 程度 ,然后 播放 一 段 音乐 。 在 socket 中 也 使 用 
了 队列 的 思想 ,当然 不 会 播放 音乐 。 

(2) 与 服务 相关 的 操作 

与 时 间 最 务 相 关 的 操作 是 包含 以 下 3 个 步骤 的 一 个 循环 。 

，” 等 街 呼叫 

等 待 在 那儿 ,不 做 任何 事情 直到 有 呼叫 进来 。 从 技术 的 和 角度 讲 , 芭 被 阻塞 在 一 个 呼叫 
上 。 当 一 个 呼叫 进来 ,你 解除 阻塞 并 接收 呼叫 。 

+ RR 

在 这 个 例子 中 ,你 看 一 下 钟 ,然后 通过 电话 线 把 时 间 告 诉 对 方 。 

。 HEW 

已 经 完成 了 对 该 呼叫 的 工作 , 挂 断 电话 。 

上 述 6 个 步骤 中 ,3 个 用 来 建立 服务 ,3 个 用 来 对 应 每 个 接 人 呼叫。 这 6 个 步骤 就 是 对 在 
电话 网 上 运行 时 间 服 务 的 详细 描述 。 

2. 使 用 服务 

客户 端 如 何 使 用 上 所 提供 的 服务 呢 ? 每 个 客户 端 都 遵循 以 下 4 个 步骤 。 

(12 获取 一 根 电话 线 

客户 端 同样 需要 一 个 通信 端点 。 客 户 端 还 要 从 电话 网 络 申请 一 个 电话 号 码 。 

(2) 连接 到 只 休 号 码 

客户 端 估 用 这 各 电 话 线 向 电话 网 络 请 求 建立 一 个 到 特定 线路 的 连接 。 客户 端 拨打 大 
楼 的 电话 太 休 办 公 室 的 分 机 ,并 与 其 相连 。 其 中 的 商务 楼 的 号 码 和 分 机 号 码 的 组 合 被 称 
为 服务 的 网 络 地 址 。 从 技术 的 角度 讲 , 商 务 楼 号 友 是 主机 地 址 ,分 机 号 码 是 端口 号 或 者 称 
为 端口 。 让 前 面 的 例子 中 ,主机 号 是 617—999- 1234 ,端口 是 8080, 

(3) 使 用 服务 

了 遇 个 通信 端点 (客户 端的 和 服务 器 端的 ) 现 在 已 经 建立 了 了 连接。 任何 一 方 可 以 通过 该 连 
接 向 另外 的 通信 端点 发 送 数据 。 以 时 间 服 务 器 为 例 , 服 务 器 通过 线路 发 送 数 据 , 而 客户 端 则 
接收 信息 。 像 目录 编排 这 样 更 加 复杂 的 服务 就 需要 服务 器 和 客户 映 之 癌 更 复杂 的 变 互 。 本 
书 在 后 面 将 分 析 更 复杂 的 服务 。 

(4) FERE T 

A BSR. AT inn AERA. 

3， 重 要 概念 

时 间 服 务 器 例子 包 合 了 socket 编程 中 所 要 涉及 的 + 个 重要 的 概念 。 

COD 客户 和 服务 器 

已 经 不 止 一 次 好 讨论 该 问题 了 了。 服务器 是 提供 服务 的 程序 。 在 Unix 中 ,服务 器 是 一 个 
程序 不 星 一 各 计算 机 。 服 务 器 进程 等 待 请 求 , 人 处 理 请 求 ,然后 循环 回去 等 待 下 一 个 请 求 。 客 
户 端 进程 则 不 需要 循环 , 它 只 需 建立 一 个 连接 ,与 服务 器 交换 数据 ,然后 继续 自己 的 工作 。 

(2) 主机 和 名 和 端口 

运行 于 因特网 上 的 服务 器 其 实 是 某 台 计算 机 上 运行 的 -个 进程 。 这 里 计算 机 被 称 为 主 
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机 .机 器 通常 被 指定 一 个 名 字 如 sales. xyzcorp. com, 这 被 称 为 该 主机 的 名 字 。 有 上 服务器 看 该 
主机 上 拥有 一 个 端口 。 主 机 和 端口 的 组 合 才 标识 了 一 个 服务 器 . 

(3) 地 址 族 

你 的 时 间 服 务必 须 拥有 ~- 个 电话 号 码 , 它 还 可 能 有 街道 地 址 和 邮编 ,甚至 可 能 有 经 度 和 
纬度 或 是 其 他 集合 的 数据 等 属性 。 上 述 每 个 集合 的 数据 都 是 你 的 服务 的 地 址 。 但 是 如 用 经 
度 和 纬度 来 代替 电话 号 码 中 的 电话 号 码 和 扩展 号 码 的 活 , 它 们 有 可 能 沾 能 正常 运作 。 

上 面 的 每 个 地 址 分 别 属 于 不 园 的 地 址 族 。 电 话 号 色 和 分 机 号 码 蚌 电 话 网 络 地 址 族 的 地 
址 ,这 里 可 以 用 AF_PHONE 来 标识 。 羔 似 地 ,经 度 和 纬度 在 全 球 坐 标 系统 地 址 族 中 才 有 意 
MFR LA AF, GLOBAL 来 标识 。 

C4) 协议 

协议 是 服务 器 和 窜 户 之 间 交 互 的 规则 。 在 时 间 服 务 器 的 例子 中 ,协议 很 简单 : 客户 坚 
叫 , 服 务 吕 回答 ,给 出 时 间 信 息 后 挂 断 ， 

如 果 运 行 的 是 一 个 查 号 辅助 服务 ,又 将 如 何 呢 ? 协议 将 会 复杂 一 点 。 服 务 器 需要 同 
答 和 发 送 初 始 欢 迎 信息 (例如 ;欢迎 访问 查 号 辅助 系统 , 请问 您 在 哪个 城市 ?”") 。 客 户 端 
给 出 城市 的 名 字 后 ,服务 器 将 询问 所 查 名 字 ( 例 如 :* 您 需要 查询 什么 ?”)。 客 户 端 以 某 公 
司 或 个 人 的 名 字 作 应 答 。 这 时 服务 器 给 出 所 要 请 求 的 电话 号 码 或 此 城市 不 存在 所 查询 的 
名 字 的 消息 。 一 些 查 号 辅助 服务 器 还 提供 付费 的 电话 服务 。 消 息 的 交互 苯 循 查 号 辅助 示 
议 (directory -assistance protocol) ,本 章 称 其 为 DAP。 每 个 客户 /服务 器 模型 都 必须 定义 这 
样 一 个 协议 。 


11.5.2 因特网 时 间 、DAP 和 天 气 服务 器 


时 间 服 务 器 和 查 号 辅助 服务 器 的 例子 不 仅仅 是 用 于 教学 的 比喻 ,它们 在 因特网 中 存在 
着 广泛 的 应 用 。 试 一 下 下 面 的 命令 : 

















$ telnet nit, edu 13 

Trying 18.7.21.69... 

Connected to mit. edu 

Escape character is '^!', 

Mon Aug 13 2236,44 2001 
Conncetion closed by [oreign host. 


$ 


位 于 MIT 的 某 台 主机 上 有 一 台 时 间 服 务 器 , 它 在 13 号 端口 等 待 请 求 。 当 用 telnet 和 该 
服务 器 连 搂 的 时 候 , 服 务 器 接收 请 求 , 检 查 系 统 时 钟 ,通过 网 络 送 回 当前 的 时 间 , 然 后 挂 断 连 
接 。 良 前 面 的 时 间 服 务 的 例子 完全 相同 ,它们 甚至 使 用 了 相同 的 协议 。 试 .下 连接 到 其 他 
主机 的 13 导 端 日 。 可 以 得 到 世界 上 其 他 任何 机 器 十 的 时 间 。 

telnet 程序 就 像 一 部 电话 。 它 和 和 远 端 主机 的 某 个 端口 建立 连接 ,然后 把 你 键盘 上 的 输入 
数据 通过 连接 发 送出 去 ,并 将 递 过 连接 接收 到 的 数据 三 示 在 屏幕 上 。 

那 查 号 辅助 服务 义 如 何 呢 ? 查 号 辅助 服务 器 通常 在 79 号 端口 鉴 听 。 例 如 ,交互 过 程 如 
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FLA: 


$ telnet princeton, edu 79 
Trying 128. 112.128.981... 


Connected to princeton. edu. 


Escape character is '*]'. 


Smith 


name. 
department. 
email. 
emailbox: 


netid: 


: 000012345 


Waldo Smith 

Special Student 

waldos(@ Princeton. EDV 
waldos(@imail. Princeton. EDU 


waldos 





alias, 
name, 
department : 
email, 
emailbox, 


netid, 


000333333 

Ignatz E Smith 
Undergraduate Class uf 1997 
ismith@Princeton. EDU 
ismith(@mail. Princeton. EDU 


ismith 


当 一 个 请 求 到 来 时 ,服务 器 接收 该 请 求 。 内 议 中 靓 定 了 客户 必须 输入 用 户 名 并 以 回 车 
结束 。 服 务 器 将 所 有 的 匹配 人 口传 同 , 然 后 挂 断 连接 
天 气 服务 又 是 怎样 呢 ? 坛 一 试 下面 的 命令 ，; 


telnet rainmaker. wunderground.com 3000 


该 天 气 服务 的 协议 更 加 复杂 REL RA AEBS. 
11.5.3 服务 列表 : 众所周知 的 端口 


如 何 知 道 端 口 13 是 时 间 服 务 端口 而 79 是 日 录 辅 助 服务 呢 9 同样 的 道理 ,在 美国 每 个 人 
都 知道 导 码 911 是 紧急 服务 ,号码 A11 是 查 号 服务 ,这 些 就 是 众所周知 的 端口 。 在 文件 /etey 
services 中 定义 子 众所周知 服务 端口 号 的 列表 : 


$ more /etc/services 


# 


# Network services, Internet style 


4 


$ NetBSD; services, v 1.18 1996/03/26 00,07.58 mrg Exp $ 


# Note that it is presently the policy of IANA to assign a single 
# well - known port number for both TCP and UDP;hence, most entries 


# here have two entries even if the protocol doesn't support UDP 


f operations. 
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# Updateed from RPC 1340, "Assigned Numbers"(July 1992). Not all 


# ports are included, only the more common ones. 


g 

+ from; @( + services 5.8 (Berkeley) 5/9/91 
# 

tcpmux l/tep # TCP port service multiplexer 

echo 7T/tep 

echo 7 /udp 

discard 9/top sink null 

discard 9/udp sink null 


systat © il/tcp users 
datetime 13/tep 
datetime  13/udp 

~— more -— (135) 


BORURIP STUUCEE ULIS UBL A EG 13. FPSO A EL L B HE 
服务 ,如 ftp,telnet finger 和 http 的 端口 。 

所 有 这 些 运 行 在 因特网 主机 上 的 服务 实际 上 都 是 基于 前 面 给 出 的 时 间 上 服务 器 模型 的 思 
想 和 步骤 的 。 这 里 将 把 这 些 思 想 应 用 于 Unix 的 系统 调用 ,从 而 编写 自己 的 时 间 服 务 器 以 及 
客户 端 版 本 ， 


11.5.4 编写 timeserv. c: 时 间 服 务 器 
上 面 提 到 的 基于 电话 的 时 间 服 务 诗 及 6 个 步 又。 每 个 步骤 与 一 个 系统 调用 相对 席 。 对 
































应 关系 如 下 上 所 示 : 
行 为 系统 调用 

l. 获取 电话 线 Socket 

2. AGES bind 

8. 允许 接 人 调用 listen 

4. S EE HB accept 

5. 传送 数据 read/write 

8. 挂 断 电话 close 
— m ľe 

程序 如 下 ， 


/* timeserv,v a socket - based time of day server 


x A 


f include < stdio. hu 
ý include <lunistd. ho 
# include «sys/types. ho» 


S include <(sys/socket. hi> 
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H include -netinet/in.h-- 
B include «netdb.hz- 
f include «time. h= 


# include < strings. h> 


# define  PORTNUM 13000  /* our time service phone number x; 
Adefine HOSTLEN 256 


#define  oopsimsg) { perror(msg) ; exit(1} ; } 


int main(int ac, char » av| |) 


i 
struct  sockaddr in saddr ; /* build our address here x/ 
struct  hostent * hp; /* this is part of our «/ 
char hostname[HOSTLEN ; /* address x/ 
int SOCK id,sock fd; /* line id, file desc «/ 
FILE * sock fp; /* use socket as stream */ 
char * ckime() ; /* convert secs to string x/ 
time t thetime; /* the time we report x/ 
fe 
z Step 1. ask kernel for a socket 
a; 
Sock id = socket( PF INET, SOCK STREAM, 0 ); /* get a socket x / 
if ( sock id == -1} 
oops( "socket" ); 
fs 


* Step 2, bind address to socket. Address is host, port 


xf 
bzero( (void * )&saddr, sizeof(saddr) 5; /* clear out struct x/ 
gethostname( hostname, HOSTLEN }; /* where am I ? «/ 
hp = gethostbyname( hostname ),; /* get info about host x/ 


/* fill in host part x/ 
bcopy( (void * }hp- >h addr, (void + )&saddr. sin addr, 
hp- >h length); 


saddr. sin port = htons{PORTNUM)} ; /* fill in socket port «/ 
saddr.sin family = AF_INET . /* fill in addr family */ 
if ( bindí(sock id, (struct sockaddr x )&saddr, sizeof(saddr)) I= 0) 


oops( "bind" >; 


, 
/* 


* Step 3; aliow incoming calls with Qsize- 1 on socket 
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if ( listen(sock id, 1} !- 0) 


oops( "listen" }- 


fs 


* main loop, accept), write(3, closet) 


af 
while ( 1 }{ 
Sock fd = accept(sock id, NULL, NULL); /x wait for call x/ 
printf( "Wow! got a call! \n"); 
if ( sock fd == -1) 
oops( "accept" 5; /* error getting calls */ 
Sock fp = fdopen(sock fd,"w"); fx we'll write to the x/ 
if ( sock fp -- NULL) /* socket as a stream */ 
oops( "fdopen" ); ¿x untess we can't x/ 
thetime = time(NULL); /x get time «/ 
/* and convert to strng */ 
fprintf{ sock fp, "The time here is .." »; 
fprintf( sock fp, "'* s", ctime(Sthetime) 5; 
fclose( sock fp); /* release connection #/ 
} 


下 面 将 对 程序 如 何 工作 给 出 解释 。 

-PR L: MAR AF socket 

socket 是 一 个 通信 端点 。 就 像 位 于 说 上 的 电话 插座 -HE socket 是 产生 呼叫 和 接收 呼叫 
的 地 方 。 系 统 调用 socket 创建 一 个 socket, 
































socket 

目标 建立 … 个 socket o 
ix # include «sys/types, h= 

# include «—sys/socket, hz 
i SIE: sockid— socket(Cint domain. int typesini protocol? 
#8 domain 通信 域 

PF INET 用 于 Internet socket 

Lype socket M22. SOCK_STREAM P8 T ili 365 fp] 

protocol HHX socker iH Br FA AT ERIM «BRIA OS O 
返回 导 = CEET E n 


sockid n TH ik [9] 
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socket JAN al — AAE fe HR PRIA. IRS Ss E AE ,每 个 被 称 
为 一 个 通信 域 。Internet 本 身 就 是 一 个 域 。 在 后 面 会 看 到 Unix 内 核 是 另 一 个 域 。Linux 支 
持 好 几 个 其 他 域 的 通信 ， 

socket 的 类 型 指出 了 程序 将 要 使 用 的 数据 流 类 型 。SOCK_STRAEAM 类 型 跟 双 向 的 
管道 类 似 。 数 据 作为 连续 的 宇 节 流 从 一 端 写 人 ,再 从 另 -… 端 读 出 。 后 面 的 章节 中 将 介绍 
SOCK DGRAM 类 型 。 

沙 数 中 最 后 的 参数 protocol 指 的 是 内 核 中 网 络 代码 所 使 用 的 协议 ,并 不 是 客户 端 和 服务 
器 之 间 的 协议 。 一 个 为 0 的 值 代表 选择 标准 的 协议 。 

* 步骤 2: Bea BE] socket 上 ,地 址 包括 主机 ,端口 

下 一 个 步 枝 是 把 一 个 网 络 地 址 分 配给 socket, dk Internet 域 中 ,地 址 由 主机 和 端口 构 
成 。 这 里 不 能 使 用 端口 13 ,因为 该 端口 已 经 为 时 间 上 服务器 保留 。 这 里 可 使 用 端口 13000 
来 代替 。 可 以 为 你 的 服务 器 端口 选择 任意 的 号 码 , 只 是 该 导 磺 不 要 本 小 县 不 能 已 经 被 占 
用 。 低 端口 号 可 能 已 经 被 系统 服务 所 占用 ,而 不 能 肯 被 普通 用 户 使 用 。 请 检查 系统 中 端 
口 的 限制 范围 。 端 口号 是 一 个 16 位 的 数值 ,所 以 有 很 多 端口 号 可 用 。 系 统 调用 bind 如 下 
Bt. 























bind 
自 标 娜 定 一 个 地 址 到 socket 
AME # include «Zsya/types, hz 
# include «sys/socket, h> 
EE ELE result— bind(int sockid, struct sockaddr * addrp, socklen_t addrlend 
参数 sockid socket AY id 


addrp 指向 包 会 地 址 结构 的 指针 
addrlen Hak BF 

RE 一 1 iB S ER 
0 成 功 








bind 调用 把 一 个 地 址 分 配给 socket。 该 地 址 的 分 配 就 类 似 于 把 一 个 电话 号 尊 分 配给 墙 
上 的 一 个 插座 ; 当 进 程 要 与 服务 髓 连接 的 时 收 , 它 们 就 使 用 该 地 址 。 每 个 地 址 族 都 有 自己 的 
格式 。 因 特 网 地 址 族 (CAF_INET} 使 用 主机 和 端口 来 标志 。 地 址 就 是 一 个 以 主机 和 端口 为 成 
员 的 结构 体 。 自 己 写 的 程序 应 首先 初始 化 该 结构 的 成 员 , 然 后 再 填充 基体 的 主机 地 址 和 端 
口号 ,最 后 填充 地 址 族 。 关 于 建立 上 述 数据 的 其 体 函 数 ,可 参阅 帮助 手册 。 

当 所 有 的 部 分 被 填充 了 之 后 ,地 址 已 经 被 绑 定 到 该 socket 上 。 其 他 类 型 的 socket 会 使 
用 包含 不 同 成 员 的 地 址 。 

* 259€ 3: 在 socket 上 ,人 允许 接 人 图 叫 并 设置 队列 长 度 为 1 

服务 器 接收 接 人 的 呼叫 ,所 以 这 蛙 的 程序 必须 使 用 listen, 
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listen 

目标 监听 socket 上 的 连接 
3k ord 4 include < sys/sacket. hz 
函数 原型 oT resulte listenCint sockid,int qsize} 
参数 sockid 接收 请 求 的 socket 

qsize 允许 接 人 连接 的 数目 
返回 入 一 1 遇 到 错误 

0 成 功 


listen 请 求 内 核 允 许 指定 的 socket 接收 接 入 呼叫 。 并 不 是 所 用 类 型 的 socket 都 能 接收 
HAE, (2 SOCK STREAM 类 型 是 可 以 的 。 第 二 个 参数 指出 接收 队列 的 长 度 。 在 本 章 
的 程序 中 请 求 的 是 一 个 长 度 为 1 的 队列 。 队列 最 大 长 度 则 取决 于 具体 socket 的 实现 。 

， WR A: 等 行 /接收 呼叫 

一 旦 socket 被 建立 并 被 分 配 一 个 屯 址 ,而 且 准 备 等 待 接收 呼 岂 ,程序 即将 并 始 工 作 。 服 
务 器 等 待 百 到 呼叫 到 来 。 它 使 用 系统 调用 accept 来 接收 调用 ， 























accept 
目标 接收 socket 上 的 .个 连接 
一 - 
f include «sys/socket, h> 
西数 原型 fd==accept(int sockid,struct sockaddr x calleridvsocklen t » uddrlenp) —— 
on Ime 


callerid B ey EE O EE bt ti H EN 

addrlenp — T8 fal EF M 2p X bb A H e RE A TF 
返回 值 1 BE: Es 

fd 用 于 读 写 的 文件 描述 符 





accept 阻塞 当前 进程 ,一 直 划 指定 socket 上 的 接 人 连接 被 建立 起 来 ,然后 accept 将 返回 
文件 描述 符 ,并 用 该 文件 描述 符 米 进行 读 写 操作 。 此 文件 蕃 述 符 实际 上 是 连 旬 呼叫 进程 的 
某 个 文件 描述 符 的 一 个 连接 。 

accept 支持 一 种 类 型 的 呼叫 者 的 ID。 在 呼叫 发 起 者 一 边 ,socket 有 自己 的 地 址 ,例如 对 
于 因特网 连接 ,地 二 就 是 主机 地 址 和 端口 号 。 如 果 callerid 和 addrlenp 指针 不 为 空 的 话 , 内 
核 将 把 呼叫 者 地 址 填充 到 callerid 所 指向 的 结构 中 ,并 把 该 结构 的 长 度 填充 到 addrlenp 所 指 
向 的 内 存单 元 中 。 

就 像 人 们 使 用 来 电 显示 的 信息 米 决定 如 何 姓 理 打 入 的 电话 一 样 ,一 个 网 络 程序 厢 以 使 
用 呼叫 进程 的 屯 址 米 决定 如 何 处 理 该 连接 ， 

。 FS. 传输 数据 

accept 调用 所 返回 的 文件 描述 符 蚌 一 个 普通 文件 的 描述 符 。 对 它 的 操作 从 第 2 章 中 学 
习 完 open 调用 之 后 一 直 在 使 用 。 程 序 timeserv c 用 [dopen 将 文件 描述 符 定向 到 缓存 的 数 
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据 流 ,以 便于 使 用 iprint! 调用 来 进行 输出 。 在 以 前 只 能 使 用 write 来 完成 这 项 工作 . 

: E360: 关闭 连接 

accept 所 返回 的 文件 描述 符 可 以 由 标准 的 系统 调用 close 关闭 。 当 一 端的 进程 关闭 了 该 
端的 socket, 若 另 一 端的 进程 在 试图 读数 据 的 话 , 它 将 得 到 文件 结束 标记 。 这 跟 管 道 的 工作 
Hi ERES AL. 





11.5.5 测试 timeserv. c 
下 面 吕 以 编译 并 运行 时 间 服 务 器 ， 


$ cc timeserv.c - o Limeserv 
5 tineserwe 
29362 


3 

ii BY AR IS UA" S." FY 2B FE. BEDA shell 将 运行 它 但 不 调用 wait AE. HAS JE EH XE TE 
accept 调用 上 。 这 里 可 以 用 telnet 连接 到 服务 器 上 : 

$ telnet 'hostname' 13000 


Trying 123.123.123.123 


Connected to somesite. net 





Escape character is '^'', 

Wow! got a call! 

The time here is .. Tuc Aug 14 11,36:30 2001 
Connection close by foreign host. 

3 

$ telnet 'hostname' 13000 

Trying 123.123.123.123 

Connected to somesite. net 

Escape character is '^ ' 

Wow! got a gallt . 

The time here ig .. Tue Aug 14 11,36,53 2001 
Connectian close by foreign host. 


3 


L thi REEL HETER LRS OTE, RS EE. [E 
用 kill deo SR 2A Hiat. 





$ kill 29362 





对 于 此 服务 器 而 评 ,telnet 程序 是 其 客户 。 但 它 并 不 总 是 适合 连接 到 任何 服务 器 上 的 。 
这 里 将 针对 该 服务 只 编写 一 个 特殊 的 客户 端 程序 。 


11.5.6 编写 timecint.c: 时 间 服 务 客户 端 
基于 电话 的 时 间 服 务 客户 端的 实现 包含 4 个 步骤 ,每 个 步骤 对 应 于 一 个 系统 调用 。 
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行 为 系统 调用 
LER MBER socket 
2. nf ung Bg sg BE connect 
3. 传送 数据 read/write 
4. 挂 断 电 | closc 

















下 而 是 这 个 程序 ，; 


/* timeclnt.c - aclient for timeserv.c 
其 usage, timeclnt hostname portnumber 


sf 


# include <i stdio, h> 

. f include <(sys/types. h> 
# include  «—sys/socket.h- 
# include  «netinet/in. h 


Hinclude  «inetdb. bh 


# define ^ oopsimsq) i perror(msg) ; exit(1); } 


main(int ac, char * av[ ]) 


1 


struct sockaddr in servadd; /* the number to call «/ 

struct hostent + hp; /* used to get number */ 

int sock_id, sock_fd; /* the socket and fd x/ 

char message[ BUFSIZ]; /* to receive message x/ 

int nesslen; /* for message length */ 
oe 


* Step 1. Get a socket 


xf 
Sock id = socket( AF INET, SOCK_STREAM, 0}; /* get a line «/ 
if ( sock id == -1) 
oops "socket" }; /* or fail «/ 
fs 


* Step 2, connect to server 
* need to build address (host,port) of server first 


xf 
bzero( &servadd, sizeof( servadd ) 5; /* zero the address x»/ 


hp = gethostbyname( av[1] ); /* lookup hosts ip # «/ 
if (hp == NULL) 


cops(av[ 1]; /* or die «/ 


beopy(hp - 7h addr, (struct sockaddr * )&servadd. sin addr, 
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hp: Lh length), 


servadd.sin port = htons(atoi(av| 2 )); /* fill in port number */ 


servadd.sin family = AF INET ; /* fill in socket type »/ 
/* now dial */ 
if ( connect(sock id,(struct sockaddr + )&servadd, 
sizeof(servadd)) | = 0) 


oops( "connect" ); 


LES 


* Step 3, transfer data from server, then hangup 


xf 
messlen = read(sock id, message, BUFSIZ); /* read stuff +’ 
if ( messlen == 1} 


oops("read") ; 
if ( write( 1, message, messlen ) J = messlen ) /» and write to */ 
oops( "write" }; /* stdout x/ 
close( sock id ); 
} 
下 向 是 对 该 程序 的 解释 ， 
* PRL: 向 内 核 清 求 建立 socket 
客户 端 需要 一 个 socket 跟 网 络 和 相连 ,就 像 时 间 服 务 中 的 客户 端 需要 一 条 电话 线 跟 电话 
网 络 相连 一 样 。 客 户 端 必须 建立 Internet 域 CAF_INET)})socket, 并 且 它 还 必须 是 流 socket 
(SOCK STREAMD, 
。 步 又 2: 与 服务 器 相连 
Pe J Sg Fin Be HE TE BY OT ALAR aS. connect 系统 调用 的 作用 实际 上 与 打 电 话 类 似 。 
































connect 
”目标 连接 到 socker 
Awe #imelude «sys types. h 
include << sys/socket. h> 
函数 原型 result— connectCint sockid, struct sockaddr * serv, addrp, socklen_t addrien) ; 
se sockid 用 十 建立 连接 的 socket 
serv addrp 4E 5T RR A 38 ek S8 FE RI ET 
addrlen eH KIS 
返回 值 一 1 ele 
00 成 功 





connect al Hiit IE E i sockid 所 标识 的 socket 和 和 由 serv_addrp 所 指向 的 socket 地 址 相 
连接 。 如 果 连 接 成 功 的 请 ,connect 返回 0。 而 此 时 ,sockid 是 一 个 合法 的 将 描述 符 , 可 以 
用 来 进行 读 写 操作 。 写 入 该 文件 描述 符 的 数据 被 发 送 到 连接 的 另 一 端的 socket, Ti M A — H 
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写 人 的 数据 将 从 该 文件 描述 符 读 取 。 

。 步骤 3 和 4: 传送 数据 和 挂 断 

在 成 功 连 接 之 后 ,进程 可 以 从 该 文件 描述 符 读 写 数据 ,就 像 与 普通 的 文件 或 管道 相连 接 
一 样 。 在 时 间 服 务 的 客户 /服务 器 例子 中 ,timeclnt 只 是 从 服务 器 读 取 一 行 数据 。 

读 取 时 间 之 后 ,客户 端 关 闭 文件 描述 符 然 后 退出 。 若 客户 端 退出 而 不 关闭 描述 符 , 内 核 
将 完成 关闭 文件 描述 符 的 任务 。 


11.5.7 测试 timecint. c 


大 家 已 经 有 好 几 页 没有 看 到 插图 了 ,大 概 已 经 忘记 这 些 代码 的 任务 了 吧 。 图 11. 9 将 
会 提醒 我 们 。 服 务 器 进程 运行 在 一 台 机 器 上 ,而 客户 端 程序 在 另 一 台 机 器 上 通过 网 络 与 
服务 器 连接 。 服 务 器 通过 write 调用 来 发 送 数据 ,客户 端 通过 read 调用 来 接收 消息 。 


' 客户 服务 器 








图 11.9 位 于 不 同 机 器 上 的 进程 


对 上 面 这 段 代码 真实 的 测试 需要 在 不 同 机 器 上 运行 这 两 个 程序 。 我 不 太 确定 下 面 写 在 
书 上 的 测试 情况 是 否 足够 明确 ,不 过 大 家 可 以 作为 参考 : 


$ hostname # 检 查 当前 机 器 
computerl.mysite.net # 第 一 台 机 器 

$ cc timeserv.c - o timeserv HERAA 

S ./timeserv& # 并 运行 它 

[1] 10739 

$ 

$ scp timeclnt.c bruce@computer2 ; # 发 送 客户 代码 到 另 一 台 机 器 


bruce@computer2’s password; 

timeclnt.c | 1KB | 1.8KB/s |ETA; 00:00:00 |100 € 
$ ssh bruce@computer2 

bruce@computer2’s password; 

No mail. 

computer2;bruces cc timeclnt.c - o timeclnt 

computer2; bruce $,/timeclnt computer1 13000 Wow! Got a call! 

The time here is ..Tue Aug 14 02,44,31 2001 


computer2 ; bruces 
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服务 器 编译 好 后 ,运行 在 机 器 1 上 。 然 后 把 客户 端 程序 复制 到 机 器 2 上 ,再 登录 到 机 器 
2。 在 机 器 2 上 ,编译 好 客户 端 后 ,然后 让 客户 端 请 求 与 运行 在 机 器 1 上 监听 在 13 000 端口 
的 服务 器 相连 接 。 这 里 看 到 的 消息 就 是 从 机 器 1 上 的 服务 器 通过 网 络 发 送 给 机 器 2 上 的 客 
户 的 。 而 客户 再 把 消息 发 送 至 标准 输出 。 

从 上 面 的 测试 结果 是 否 能 真 的 看 到 机 器 2 上 的 输出 ? 我 是 从 机 器 1 连接 到 机 器 2 的 ,所 
以 显示 消息 的 终端 实际 上 是 连接 到 机 器 1 上 的 。 后 面 的 一 些 练习 会 让 你 仔细 考虑 其 运作 
原理 。 

通过 timeserv/timeclnt 程序 ,可 以 得 到 另 一 台 机 器 上 的 时 间 。 检查 另 一 台 机 器 上 的 时 
间 可 以 保证 不 同 机 器 的 时 钟 同步 。 网 络 上 的 某 台 机 器 可 以 作为 权威 时 间 服 务 器 ,而 其 他 的 
机 器 可 以 利用 上 面 的 程序 周期 性 地 来 调整 自己 的 时 钟 。 


11.5.8 男 一 种 服务 器 : 远程 的 Is 


下 一 个 项 目 是 编写 一 个 可 以 打印 远 端 机 器 上 文件 列表 的 程序 。 你 可 能 在 两 台 机 器 上 拥 
有 账号 。 若 想 看 另 一 台 机 器 上 的 文件 列表 时 如 何 去 做 呢 ? 可 以 登录 到 另 一 台 机 器 上 ,然后 
运行 ls。 一 个 快速 的 且 更 加 方便 的 途径 是 运行 一 个 远程 的 ls 程序 ,这 里 称 它 为 rls(remote 
ls)。 可 以 指定 主机 名 和 目录 : 


$ rls computer2. site.net /home/me/code 


当然 ,rls 需要 在 另 一 台 机 器 上 的 一 个 服务 进程 接收 请 求 ,处 理 请 求 和 返回 结果 。 该 系统 
看 上 去 类 似 于 图 11. 10。 服务 器 运行 在 一 台 机 器 上 ,客户 运行 在 另 一 台 机 器 上 并 与 服务 器 连 
接 , 把 目录 的 名 字 发 送 给 服务 器 。 服务 器 将 位 于 该 目录 下 的 文件 列表 信息 返回 给 客户 端 。 
客户 端 将 结果 送 至 标准 输出 把 它们 显示 出 来 。 两 进程 系统 提供 了 对 于 不 同 机 器 上 的 目录 访 
问 的 支持 。 





图 11. 10 一 个 远 端的 1s 系统 
1. 设计 远程 ls 系统 
这 里 需要 3 个 要 素来 实现 rls RH: 
(1) 协议 
(2) 客户 端 程序 
(3) 服务 器 端 程序 
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2. dix 

UMAGLACHGHORORUE. HA APWR IOS ARAZRN AK. WA REM 
该 目录 名 之 后 打开 并 读 取 该 且 录 :然后 把 文件 列表 发 送 到 窗户 端 。 客 户 端 循 环 地 读 取 文件 
PR: EC t Sp as HEUTE BET AE OES Rose 

3. BP REA. rls 


/* rls. — a client for a remote directory listing service 
* usage, rls hostname directory 

xf 

f include <(stdio. h> 

4 include 9 «sys/types. h> 

# include — «2sys/socket. h> 

Ë include —|netinet/in, ho 


F include — —netdb. hit 


# define oopsi mag) | perror(msq); exit(1); } 
# define PORTNUM 15000 


main(int ac, char * avf ) 


1 
i 


struct sockaddr in servadd; /* the number to call «/ 
struct hostent * hp; /* used to get number x»/ 
int sock_id, sock fd; /* the socket and fd «/ 

char  buffcer[BUFSIZ ; /* to receive message */ 
int — n read; /* for message length x/ 


if Cac t= 3) exit(1); 


/** Step 1, Get a Socket * x/ 


sock id = socket( AF INET, SOCK STREAM, D }; /* geta line «/ 
if { sock id == -1) 
oops( "socket" 2; /* or fail s’ 


/* * Step 2; connect Lo server x x/ 


bzero( &servadd, sizeof(servadd) ); /* zero the address  x/ 
hp = gethostbyname( av[1] 5; /* lookup host's ip #  «/ 
if (hp == NULL) 

oopstav[ 15; /* or die #/ 
bcopy(hp- —h addr, (struct sockaddr + J&servadd. Sin addr, hp- 7h length); 
servadd.sin port = htons(PORTNUM); /* fill in port number +/ 
servadd.sin family = AF INET ; /* fill in socket type x/ 
if ¢ comect(sock id,(struct sockaddr + )&servadd, sizeof(servadd)) | = 0) 


oops( "connect" ), 


/* * Step 3, send directory name, then read back results * «/ 
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if ( write(sock id, av[2], strlen(av[2])) == 一 1) 
oops( "write"); 
if ( write(sock id, "An", 1) == -1) 


oops( "write"); 
while( (n read = read(sock id, buffer, BUFSIZ)) > 0 ) 
if ( write(1, buffer, n read) == -1) 
oops("write"); 
close( sock id); 


} 


注意 该 客户 端 与 时 间 服 务 客户 端的 不 同 之 处 。rls 客户 端 首先 把 目录 名 写 到 socket H, 
上 面 的 协议 规定 了 客户 端 每 次 发 送 一 行 ,因此 程序 中 在 行 尾 增加 一 个 换行 符 。 接 下 来 ,客户 
端 进入 一 个 循环 ,将 从 socket 所 接收 的 数据 复制 到 标准 输出 ,直到 接收 到 文件 结尾 标志 。 
rls. c 使 用 低级 别 的 write 和 read 调用 来 和 服务 器 交换 数据 。 循 环 中 用 到 了 标准 大 小 的 缓存 
以 提高 效率 。 下 面 将 编写 服务 器 端的 程序 。 

4. 服务 器 程序 : rlsd 

服务 器 必须 得 到 一 个 socket, 然 后 调用 bind, listen 命令 ,最 后 调用 accept 来 接收 一 次 呼 
叫 。 在 接收 呼叫 之 后 ,服务 器 从 socket 读 取 目 录 名 ,然后 列 出 该 目录 下 的 内 容 。 服 务 器 是 如 
何 给 出 文件 列表 的 呢 ? 这 里 可 以 把 第 3 章 写 的 ls 程序 复制 过 来 ,但 也 可 以 用 一 个 更 简单 的 
方法 : 仅仅 使 用 popen 读 取 常 规 版 本 的 Is 程序 的 输出 ,如 图 11. 11 所 示 。 





Is 输出 
图 11.11 使 用 popen"ls" 来 显示 远 端 目录 


下 面 的 代码 中 使 用 了 popen: 


/* rlsd.c — a remote ls server 一 with paranoia 
*/ 

# include <stdio.h> 

# include <unistd.h> 

# include <sys/types.h> 

# include <sys/socket. h> 

# include <netinet/in. h> 
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B include  -—netdb.h-c- 
include  —time.ho 


# include «strings. hl 


# define  PORTNUM 15000 
itdefine HOSTLEN 256 
# define  oopsimsg) 


/* our remote ls server port »/ 


| perror(msg) ; exit(1) ; | 


int main(int ac, char * av[ ]} 


4 
struct sockaddr_in 


struct  hostent 


char hostname[ HOSTLEN | ; 


saddr, /* build our address here x/ 


* hp; 


int Sock id,sock fd; 


FILE x sock fpi, * sock fpo; 


FILE * pipe fp; 


char dirname! BUFSIZ|; 
char command[ BUFS1Z]; 


int dirlen, c; 


jx this is part of our x/ 
/* address «/ 
/* line id, file desc «/ 
l /* streams for in and out x/ 
/* use popen to run 1s «/ 
/* from client +/ 


/* for popen() «/ 


/** Step l, ask kernel for a socket x x/ 


SOck id = socket( PF INET, SOCK STREAM, 0 ); /* get a socket x/ 
if ( sack id == —-1) 


Oops "socket" 5; 


/** Step 2, bind address to socket. Address is host,port + x/ 


bzerot (void « )&saddr, sizeof(saddr) ); 


/* clear out struct */ 


gethostname( hostname, HOSTLEN ); /* where am I ? x/ 


hp = gethostbyname( hostname ); 


/* get info about host «/ 


bcopy( (void * )hp- —h addr, (void * )&saddr.sin_addr, hp- 7h length); 


Saddr.sin port = htons(PORTNUM), 
saddr.sin family — AF INET ; 


/* fill in socket port x/ 
/* fill in addr family */ 


if ( bind(sock id, (struct sockaddr + )&saddr, sizeof(saddr)) |= 0) 


cops "bind" ); 


/** Step 3, allow incoming calls with Qsize = 1 on socket * x/ 


if ( listen(sock id, 1) |= 03 


oops( "listen" ); 


is 


* main loop; accept(), write(), clase() 


: 


xj 
while € 1 }{ 
Sock fd = accept(sock id, NULL, NULL); /* wait for call »/ 
if ( sock fd == -1} 
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oopst "accept"); 
/* open reading direction as buffered stream x/ 
if( (sock fpi = fdopen(sock fd,"r')) == NULL) 


oops( "fdopen reading"); 


if ( fgets(dirname, BUFSIZ- 5, sock fpi) == NULL) 
cops( "reading dirname") ; 


sanitize(dirname); 


/* open writing direction as buffered stream x/ 
if ( (sock fpo - fdopeni(sack fd,"w")) == NULL) 


oops("fdopen writing"); 


sprintftcommand, "ls * s", dirname); 
if ( (pipe fp = popen(command, "r"J) == NULL) 


oops{ "popen") + 


/* transfer data from ls to socket +/ 
while( (c = getc(pipe fp)) !- HOF > 
putc(c, sock fpol; 
pclose(pipe fp); 
fclose(sock fpo); 
fclose(sock fpi); 


} 


sanitize(char x str) 
fe 
* it would he very bad if someone passed us an dirname like 


* "; rm * "and we naively creaLed a command “ls ; rm x " 
x 
* go..we remove everything but slashes and alphanumerics 


* There are nicer solutions, see exercises 


*/ 


char * src, » dest; 


for ( sre = dest = str ; * src ; src ) 
if( *src == '/' || isalnum( » src) ) 
* dest t+ = # sre; 


* dest = MO'y, 


注意 服务 器 程序 使 用 标准 缓存 流 来 读 写 数 据 。 服 务 器 用 fgets 调用 从 客户 端 读 取 目录 
名 。 在 调用 popen 后 ,服务 器 就 像 复制 文件 一 样 地 使 用 getc 和 pute 来 传输 数据 。 当 然 ,服务 
器 实际 上 基 从 本 机 上 的 进程 向 另 一 台 机 器 上 的 进程 复制 数据 。 
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注意 sanitize PORCH EUH. XE TAL aie ITE ROPE 0 d BM Be a) 
服务 器 ,在 编写 的 时 候 都 要 格外 小 心 。 RRP PAD AR SF ae SE Pe BOR A A a AY Boe m AS 
把 它 追 加 到 ls eS BS ES, PUn. WR EP i A a EAB / bin” ,服务 器 将 创建 并 运行 “ls / 
bin "命令 。 这 是 正确 无 误 的 。 HR MRRARAKP AB: rm * ”给 服务 器 ,服务 器 将 创建 
并 运行 "ls ; rm x* "命令 了 。 

为 了 减少 被 破坏 的 风险 ,程序 中 必须 确保 接收 的 字符 忠 没 有 溢出 输入 绥 存 ,也 没有 洲 出 
给 命令 设置 的 缓存 并 且 接 收 的 和 且 录 名 中 不 允许 出 现 非法 字符 。popen 系统 调用 对 于 编写 网 
络 服务 来 说 是 很 危险 的 ,内 为 它 直 接 把 一 行 字符 串 传 给 sheil。 在 网 络 程序 中 ,将 字符 串 传 给 
shell 是 一 个 非常 错误 的 息 法 。 举 这 个 鲍 子 的 目的 有 两 个 : 首先 ,展现 popen 的 另 一 种 用 法 
其 次 则 是 警告 大 家 其 危险 性 。 在 使 用 的 时 候 务 必 小 心 ! 


11.6 软件 精灵 


像 很 多 Unix 程序 一 样 ,Unix 服务 器 程序 有 短小 .简洁 的 名 字 。 很 多 服务 器 程序 都 是 以 
站 结尾 ,如 httpd, inetd, syslogd 和 atd, RHA d 表示 精灵 (daemon) 的 意思 ;因而 如 省 叫 
syslogd 的 服务 器 程序 实际 上 是 系统 日 志 精 灵 (system log daemon)。 精 灵 就 是 一 个 为 他 人 
提供 服务 的 帮助 者 , 它 随 时 等 待 去 帮助 别人 。 在 你 的 系统 中 ,输入 命令 ps -el 或 ps -ax 就 
可 以 看 到 以 字符 由 结尾 的 进 种 ， 然 后 ,可 以 去 阅读 这 些 命令 的 帮助 信息 ,从 商 可 以 更 加 深入 
地 理解 Unix 中 用 客户 /服务 器 模型 是 如 何 来 处 理 … 些 基础 操作 的 。 

大 部 分 精灵 进程 都 是 在 系统 局 动 后 就 处 于 运行 状态 了 。 位 于 类 似 于 /eteyrc. d? 目录 中 
的 shell 脚本 在 后 台 启 动 了 这 些 服务 ,它们 的 运行 与 终端 相 分 离 ,时 刻 准备 提供 数据 或 服务 。 





小 结 


|l. 主要 内 容 

”一 些 程序 被 作为 单独 的 进程 建立 起 来 来 接收 和 发 送 数据 。 在 客户 /服务 器 模型 中 , 服 
务 器 进程 为 客户 进程 提供 处 理 或 数据 服务 。 

客户 /服务 器 系统 包含 通信 系统 和 协议 。 客 户 和 服务 器 通过 管道 或 socket 进行 通信 。 
协议 是 会 活 过 程 中 一 系列 规则 的 集合 。 

popen 库 函 数 可 以 将 任何 shell 程序 嵌入 服务 器 程序 并 且 让 对 服务 器 的 访问 就 像 访 
问 缓存 文件 一 样 。 

管道 是 一 对 相连 接 的 文件 描述 符 。socket 是 一 个 未 连接 的 通信 端点 ,也 是 一 个 潜在 
的 文件 描述 符 。 客 户 进 程 道 过 把 自己 的 socket 和 服务 器 端的 socket 相连 来 创建 一 
个 通信 连接 。 

sockets 之 问 的 连接 可 以 扩展 到 另 一 台 机 器 上 。 每 个 socket 以 机 器 地 址 和 端口 来 
标识 。 

















D ARARAT Unix 的 版 本 。 
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* 到 管道 和 和 socket 的 连接 使 用 文件 描述 符 。 文 件 描述 符 为 程序 提供 了 与 文件 .设备 和 
其 他 的 进程 通信 的 统一 编程 接口 。 
2. 下 一 步 的 工作 


本 章 学 


习 了 客户 /服务 器 模型 编程 的 设计 和 两 种 连接 进程 的 方法 ; 管道 和 socket。 在 下 


一 章 中 ,将 集中 精力 学 习 客 户 / 服 务 器 模型 编程 的 设计 原理 ,并 编写 更 加 复杂 的 程序 。 特 别 
地 ,了 一 章 将 把 对 socket 编程 和 文件 系统 及 进程 控制 的 知识 相 结合 来 编写 一 个 Web 服务 器 


3， 习 题 


11.1 


11.2 


11. 3 


11.4 


11.5 


TUR AR E E R e — 2C HG GE SP SE RE E AR fe EE AE SA BA I p A S. o An 
fj? 协议 将 更 加 复杂 。 为 送 外 卖 服务 描述 在 服务 器 和 客户 之 间 传 送 的 消息 序 
列 。 注 意 该 协议 包含 有 一 个 循环 ,以 便 多 许 客户 增加 定购 项 。 


本 章 中 的 popen 版 本 没有 对 信和 号 做 任何 处 理 , 这 是 不 是 正确 ? 子 进程 从 父 进程 那 
里 继承 了 信号 处 理 的 设置 。 在 考虑 以 下 三 种 情况 如 何 对 父 进 谷 信和 号 进行 处 理 之 
后 ; 回 管 该 问题 ; 终止 . 怨 略 以 及 调用 函数 。 


在 时 间 服 务 器 和 客户 端 运 行 的 例子 中 ,使 用 了 ssh 命令 从 机 器 1 登录 到 机 器 2. 
此 时 仍 登 录 在 机 器 1 上 ,但 是 在 机 器 2 上 却 运行 了 一 个 shell 进程 。 该 shell 程序 
编译 并 运行 了 时 间 服 务 客户 端 。 

我 的 终端 确实 是 连接 到 机 器 上 了 。 童 新 夯 图 11. 11 ,使 得 该 图 包含 机 器 1 上 的 
shell, #L#E 2 下 的 shell £ 9 DA RM timecint 到 终端 正 桶 的 数据 流 。， 这 可 是 一 个 
相当 复杂 的 数据 水 蛾 。 


前 面 的 章节 中 可 以 看 到 梯 瘟 文件 和 设备 文件 都 支持 标准 的 文件 接口 ,但 是 到 厂 
答 文 件 的 连接 与 到 设备 文件 的 连接 具有 完全 不 同 的 属性 集 。 那 么 socket 具有 什 
么 样 的 属性 呢 ? 参阅 setsockopt 的 帮助 手册 以 获取 更 详细 的 信息 。 





远 端 目录 服务 运行 了 ls 命令 。 当 ls 发 生 错 误 的 时 候 , 将 会 发 生 什 么 事情 嘱 ” i 
如 ,指定 的 日 录 不 存在 或 对 于 服务 器 而 言 不 可 读 ,那么 对 ls 所 产生 的 错误 信息 如 
ARRIE? 可 以 考虑 丙种 处 理 来 自 ls 的 错误 信息 的 方法 。 首 先 ,如 何 把 错误 信 
EUR FLA AE Pio 其次, 如何 把 错误 信息 存放 到 日 志 中 并 通知 用 户 ? 


4. 编程 练习 


11.6 


11.7 


11. 8 


给 tinybe 程序 增加 一 c 选 项。 一旦 载 加 了 该 选项 ,下 而 的 命令 将 能 够 工作 ， 
printf "2 +2\n4 * 4\n"|tinybe - c|dc 
为 你 的 shell 增加 一 c 选项 。 需要 改变 什么 呢 ? 


编写 pelose 程序 。 该 函数 以 popen 返回 的 FILE * 作为 参数 。fdopen 函数 为 组 
存 和 和 短 记 信息 分 配 了 内 存 空间 。iclose BRE RIK ATES EA HIRE. BB 
4 pelose 还 必须 做 些 什 么 呢 ? 车 男 一 个 子 进 程 死 在 popen 和 pelose i Hi zz [8], 














1l. 10 


11. 11 


11.12 
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结果 又 将 会 怎样 ? 
11.9 本 章 中 的 时 间 服 劳 器 并 没有 于 到 系统 调用 accept 所 提供 的 调用 者 ID 的 特性 。 


修改 timeserv. c; 使 得 它 在 接收 到 请 求 时 可 以 打印 出 如 Got a call from 123. 123. 
123. 123 (computer2. mysite, net}, 


可 以 阅读 帮助 手册 和 头 文件 米 了 解 该 工程 中 所 需要 的 函数 和 结构 体 。 


写 一 个 程序 将 sort 作为 子 程序 调用 .程序 须 读 取 多 行 数据 ,存放 到 字符 串 数 组 
中 。 接 状 程 序 创 建 两 个 管道 ,然后 创建 -个 进程 来 运行 sort。 通 过 一 个 管道 把 
输入 序列 发 送 给 sort 的 输入 ,再 关闭 该 管道 。 通 过 另 一 个 管道 读 取 sort 的 输 
出 .再 把 结果 存 回 数组 中 ,并 打印 该 数组 ， 


基于 System V 的 Unix 版 本 提供 了 对 双向 管道 的 支持 。 通 过 运行 下 面 的 程序 ， 
可 以 测试 某 个 版 本 的 Unix 是 否 支 持 双向 管道 


: 
i% 








* testbpd.c 一 test bidirectional pipes 


af 
maini } 
int p|2]; 
if ( pipe(p) == - 1) exit(1)5; 
if ( write(p[0;, "hello", 5) == -1) 
perror("write into pipe[ 0] failed"); 
else 


printf("write into pipe[O | warked\n") ; 
i 

TE PARE RHEE ACE PAS DA. 一 个 从 pipeL0] 到 pipe[1], 另 一 个 则 方向 相反 。 
问 管道 的 一 问 写 数据 操作 会 把 数据 放 人 到 通 向 另 一 端的 队列 中 ,而 从 管道 的 一 
端 读 数据 则 将 数据 从 那 端 取出 并 送信 本 端的 队列 中 。 
如 果 你 的 系统 不 支持 双向 算 道 ,可 以 生成 如 下 调用 

# include < sys/types, hi 

# include < sys: socket. hi> 

int apipe[ 2; /* a pipe x/ 

socketpair(AF UNIX, SOCK STREAM, PF UNSPEC, apipe); 


重新 编制 程序 tinybe. ce, 使 它 使 用 一 个 双向 管道 而 不 是 使 用 两 个 单 向 的 管道 。 


更 改 timeserv. e 程序 ,使 得 它 只 响应 来 自 特定 IT hE ERLE Pe. ARS 
收 坚 叫 并 检查 客户 端 地 阜 。 如 果 客 户 端 地 址 不 是 特定 的 三, 则 服务 器 挂 断 , 否 
则 ,服务 器 将 时 间 返 回 。 

增强 该 阳 守 特征 使 服务 器 可 以 从 文件 中 读 取 所 能 接收 的 IP 地 址 列表 。 措 述 该 
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技术 的 一 些 实际 应 用 。 


大 家 知道 在 服务 器 端 使 用 popen 调用 是 非常 危险 的 有 两 种 方法 来 解决 该 问 
题 。 第 一 种 方法 是 编写 一 个 更 加 灵活 ,但 非常 安全 的 sanitize HR. Hi, Bw 
名 中 人 允许 含有 逗 导 . 破 折 号 .空格 和 其 他 字符 。 并 卫 月 录 名 中 还 可 以 售 有 星 号 
TE XX Ab BERI ELS shell 一 样 ,给 这 些 字符 赋予 特征 的 含义 。 写 一 -个 更 加 
AAW PRR SS RR RR. 

另外 一 种 方法 是 放弃 使 用 popen ,用 fork exec 和 dup FAR. 用 这 种 方法 米 重 
写 zlsd. ec 程序， 其 中 需要 用 到 wait? 为 什么 ? 


编写 -- 个 位 于 端口 79 的 目录 辅助 服务 器 (finger 服务 器 )。 服 务 器 接收 单行 的 
用 记名 给 入 ,然后 给 客户 端 发 送 一 个 列表 ,其 中 包含 与 输入 此 配 的 所 有 用 户 ， 


代理 (proxy) 指 的 居 接 收 请 求 ,把 该 请 求 转发 给 其 他 的 服务 器 ,然后 再 将 从 服务 
器 中 传 回 的 结果 返回 给 程序 。 这 就 类 做 于 干洗 店 的 前 台 ，, 它 不 做 清洁 工 作 ,只 
是 把 衣服 传送 到 洗衣 设备 或 从 洗衣 设备 取 衣 服 。 

编号 一 个 时 间 报 务 器 代理 。 你 的 程序 应 当 可 以 接收 标准 端口 上 的 连接 。 为 了 
处 理 该 连接 ,程序 需要 和 真 的 时 间 服 务 建立 连接 ,从 该 服务 器 取得 时 间 ,然后 把 
SERERE ARE PU 


考虑 上 一 题 中 的 关于 代理 服务 器 的 概念 。 时 间 只 是 每 秒 钟 政变 一 次 :如 果 你 的 
代理 服务 大 在 几 毫 秒 中 接收 了 很 多 请 求 ,就 根本 不 可 能 在 这 么 短 的 时 间 内 向 时 
间 般 务 器 发 送 许多 请 求 。 编写 一 个 时 间 代 理 服 务 器 ,可 以 缓 在 从 时 间 服 务 器 污 
取 的 时 间 , 只 有 在 新 的 呼叫 超过 了 1 秘 的 间隔 之 后 才 去 向 时 间 服 务 器 发 送 请 求 
(Z& gettimeofday) , 








BS BAR AA d E — Rit Ae Tp DO I SBE. BE finger 
服务 器 中 采用 缓存 技术 则 是 有 意义 ,解释 原因 。 编 写 一 个 目录 辅助 服务 器 ,使 
其 可 以 缓存 用 户 信息 。 

缓存 时 间 服 务 吕 中 所 缓存 的 每 个 元 素 都 有 自然 的 生命 周期 (1 BH), ,但 是 在 组 
存 的 且 录 辅助 服务 器 中 如 何 决定 用 户 信息 的 保存 时 间 呢 ? 


有 些 面包 店 有 一 台 给 客户 分 发 编号 的 机 器 。 柜 台 上 写 着 “正在 服务 ”的 牌子 上 
显示 了 下 一 个 顾客 的 编号 。 设计 一 个 客户 /服务 器 程序 来 实现 面包 数字 服务 项 
系统 。 服 务 器 产生 连续 编号 。 用 户 运行 客户 端 程序 来 获取 服务 器 端的 数字 。 


每 个 C 程序 员 都 知道 argv[0] 通 常 表示 正在 运行 的 程序 名 称 。 有 一 种 比较 接近 
的 方法 可 以 使 一 个 进程 获得 自己 的 和 名字。 程序 可 以 使 用 popen, 然后 从 ps 命令 
的 输出 中 来 搜索 自己 的 进程 ID。 编写 一 个 使用 该 方法 的 程序 。 
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* IRS dB socket. 目的 和 构造 

* 客户 端 socket. 目的 和 构造 

。 客户 /服务 器 协议 

* 服务 器 设计 ; 使 用 fork 来 接收 多 个 请 求 
。 [i (zombie) ji) Bt 

+ HTTP 


12.1 服务 器 设计 重点 


使 用 万 维 网 是 容易 的 ,只 要 在 浏览 器 中 输入 一 个 网 址 或 者 单 击 一 个 超 链 ,上 骤 务 器 就 会 把 
相应 的 网 页 发 送 过 来 。 但 是 Web 是 怎样 工作 的 ? 从 Web 服务 器 上 获取 网 页 和 从 时 间 服 务 
器 获取 时 间 是 类 位 的 吗 ? 

基于 socket 的 客户 /服务 器 系统 大 多 是 类 似 的。 虽然 电子 邮件 .文件 传输 .远程 登录 和 
分 布 式 数据 库 , 以 及 其 他 的 Internet 服务 在 屏幕 上 上 显示 的 内 容 相 异 , 但 是 它们 的 运作 原 运 是 
一 致 的 。 

一 旦 理解 了 一 个 socket 流 的 客户 /服务 器 系统 ,就 可 以 理解 大 多 数 其 他 的 系统 。 在 本 章 
中 ,将 学 习 网 络 编程 的 基本 操作 和 设计 原则 ,然后 使 用 它们 来 建立 一 个 Web 服务 器 。 


12.2 三 个 主要 操作 


在 第 11 章 看 到 的 基于 socket 流 的 客户 /服务 器 系统 与 图 12.1 看 上 去 类 似 。 客 户 和 服 
务 器 都 是 进程 。 服 务 器 设立 服务 ,然后 进 人 循环 接收 和 处 理 请 求 。 客户 连接 到 服务 器 ,然后 
发 送 、 接 受 或 者 交换 数据 ,最 后 退出 。 该 交互 过 程 中 主要 包含 了 以 下 3 个 操作 : 

(1) 服务 器 设立 服务 。 

(2) 客户 连接 到 服务 器 ， 

(3) 服务 器 和 客户 处 理事 务 。 
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客户 : 服务 器 : 
设立 服务 

连接 到 服务 器 。 ---------------- > ”接收 请 求 

获取 服务 ems | 

挂 断 连接 挂 断 连接 


图 12,1 客户 /服务 器 交互 中 的 主要 步 又 


下 面 将 分 别 讨 论 每 个 操作 。 


12.3 操作 1 和 操作 2: 建立 连接 


基于 流 的 系统 需要 建立 连接 。 这 里 将 回顾 一 下 建立 连接 的 步骤 ,然后 将 这 些 步骤 抽象 
成 一 些 库 函 数 。 


12.3.1 操作 1: 建立 服务 器 端 socket 


首先 ,如 图 12. 2 所 示 ,描述 了 服务 器 设立 一 个 服务 的 过 程 。 设 立 一 个 服务 一 般 需要 如 下 
个 * 
3 个 步骤 ， 
(1) 创建 一 个 socket 
socket = socket(PF_INET, SOCK_STREAM,0) 
(2) 给 socket 绑 定 一 个 地 址 
bind(sock, &addr, sizeof(addr)) 
(3) 监听 接 人 请 求 


listen(sock, queue size) 







p2 SE 
创建 一 个 服务 器 端 socket 


图 12.2 创建 服务 器 端 socket 
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为 了 避免 在 编写 服务 器 时 重复 输入 上 述 代码 ,将 这 3 个 步 又 组 合成 一 个 函数 : make 
server_socket。 该 函数 的 代码 位 于 本 章 后 面 将 给 出 的 socklib. c 文件 中 。 在 编写 服务 器 的 时 
候 , 只 要 调用 该 函数 就 可 以 创建 一 个 服务 器 端 socket。 具 体 如 下 ， 


Sock = nake server socket(int portnum) 


return — 1 if error, 


or a server socket listening at port "portnum" 


12.3.2 操作 2: 建立 到 服务 器 的 连接 


其 次 ,将 客户 连接 到 服务 器 。 如 图 12. 3 所 示 , 基 于 流 的 网 络 客户 连接 到 服务 器 包含 以 下 
两 个 步骤 ， 
(1) 创建 一 个 socket 
Socket = socket(PF INET, SOCK STREAM, 0) 


(2) 使 用 该 socket 连接 到 服务 器 


connect(sock, &serv addr, sizeof(serv addr)) 
将 这 两 个 步骤 抽象 成 一 个 函数 : connect to, server, 当 编写 客户 端 程序 时 ,只 要 调用 该 函数 就 可 以 建立 
到 服务 器 的 连接 。 具 体 如 下 : 


fd = connect to server(hostname, portnum) 


return - 1 if error, 


or a fd open for reading and writing connected to the socket at port "portnum" on host "hostname" 
P 


步骤 2: 创建 并 
连接 客户 socket 
到 服务 器 





图 12.3 连接 到 服务 器 


12.3.3  socklib, c 


/* socklib.c 

* 

* This file contains functions used lots when writing internet 
* client/server programs. The two main functions here are, 

* 

* int make server socket( portnum ) returns a server socket 

* or 一 1 if error 

* int make server socket q( portnum, backlog) 


* 


* int connect to server(char x hostname, int portnum) 
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x 
x 

af 

3 include 
# include 
# include 
# include 
# include 
# include 
# include 
# include 


# define 
# define 


< stdio.hc» 
*Cunistd. ho 
<ays/ types. h> 
«eys / socket. hz» 
< netinet/ in. h 
<Cnetdb. ho 

< tine. ho 


«strings. h> 


HOSTLEN 256 
BACKLOG 1 


returns à connected socket 


or 1 if error 


int make server socket q(int , int 5; 


int make server socket(int portnum) 


{ 


return make server socket q(portnum, BACKLOG) ; 


+ 


int make server socket qg(int portnum, int backlog) 


i 


struct sockaddr in saddr; 


struct hostent » hp; 


/* build our address here »/ 


/* this is part of our «/ 


char —hostname[ HOSTLEN !; /* address «/ 
int Sock id; /* the socket #/ 
sock id = socket(PF INET, SOCK STREAM, 0); /* get a socket «/ 


if ( sock id == -1) 


return - 1; 


/* * build address and bind it to socket * #/ 


bzero((void * J&saddr, sizeof(saddr)) - 


gethostname{ hostname, HOSTLI 





EN) ; 
bp = gethostbyname{ hostname) ; 


/* clear out struct «/ 
/* where am I ? «/ 

/* get info about hosti «/ 
/* fill in host part x/ 


bcopy( (void * )hp- —-h addr, (void + )&saddr.sin addr, 
hp- >h Length); 


saddr.sin port = htons(portnum); 


saddr.sin family = AF INET ; 


/* Fill in socket port x/ 
/* fill in addr family «/ 


if ¢ bind(sock id, (struct sockaddr + )&saddr, 
sizeof(saddr)) 1= 0) 


return — 1; 


/* * arrange for incoming calls x» «,/ 
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if ( listen(sock id, backlog) [= 0) 
return - 1; 
return sock id; 


} 


int connect to server(char # host, int portnum) 


1 


int sock; 
struct sockaddr in servadd; /* the number to call x/ 
struct hostent * hp; /* used to get number +/ 


/* * Stepl. Get a socket s x/ 


sock = socket( AF INET, SOCK STREAM, 0 5; /* get a line x/ 
if( sock == -1) 
return - 1; 


/* * Step 2. connect to server * x/ 


bzero( &servadd, sizeof(servadd) ); /* zero the address «/ 
hp = gethostbyname( host ); /* lookup host's ip # */ 
if (hn == NULL) 

return — 1; 


bcopy(hp - 7h addr, (struct sockaddr + )&servadd. Sin addr, 

hp- >h length); 
servadd.sin port = htons(portnum); /* fill in port number «/ 
servadd.sin family - AF INET ; /* till in socket type x/ 


if ( connect(sock, (struct sockaddr » )&servadd, 
sSizeof(servadd)) |= 0) 
return — 1; 


return sock; 


12.4 操作 3: 客户 /服务 器 的 会 话 


至 此 ,可 以 使 用 专门 的 函数 来 建立 服务 器 端的 socket, 同 时 也 有 专门 的 函数 来 连接 到 服务 器 。 
在 实践 中 ,如 何 利 用 上 述 冰 数 呢 ? 客户 和 服务 器 之 间 的 交互 内 容 又 是 什么 呢 ” 在 本 节 中 ,将 学 习 
客户 端 程序 和 服务 器 端 程序 编写 的 --- 般 形式 ,以 及 一 些 建立 服务 器 的 设计 方案 。 

1, 一 般 的 客户 端 

网 络 客户 通常 调用 服务 器 来 获得 服务 ,一 个 与 型 的 客户 程序 如 下 ， 


maing} 
1 
int fd; 


fd- connect to server(host,port); /x call the server x/ 
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if(fd == 一 1) 

exit(1); /* or die */ 
talk with server(fd); /* chat with server */ 
close(fd); /* hang up when done x / 


} 


函数 talk with server 处 理 与 服务 器 的 会 话 。 具 体 的 内 容 取决 于 特定 应 用 。 例 如 ， 
e-mail 客 户 和 邮件 服务 器 交谈 的 是 邮件 ,而 天 气 预报 客户 和 服务 器 交谈 的 则 是 天 气 。 


2. 一 般 的 服务 器 端 
一 个 典型 的 服务 器 如 下 : 
nain() 
{ 
int sock, fd; /* socket and connection */ 
sock = make server socket(port); | 
if(sock == 一 1) 
exit(1); 
while(1) 
{ 
fd = accept ( sock, NULL, NULL) ; /* take next call */ 
if(fd == -1) 
break; /* or die */ 
process request(fd); /* chat with client «/ 
close(fd); /* hang up when done x/ 


} 
} 


函数 process request 处 理 客户 的 请 求 。 具 体 的 内 容 取 决 于 特定 应 用 。 例 如 ,邮件 服务 
器 告诉 客户 信件 信息 ,天 气 服务 器 则 告诉 客户 天 气 情况 。 


12.4.1 使 用 socklib.c 的 timeserv/timeclnt 


如 何 利用 上 面 的 模板 来 建立 客户 /服务 器 系统 呢 ? 例如 ,在 该 框架 下 本 文 的 时 间 系 统 客 
户 / 服 务 器 是 怎样 的 呢 ? 图 12.4 对 此 做 了 解释 。 为 了 使 用 socklib. c 重 写 时 间 客 户 和 服务 
器 ,这 里 编写 了 处 理会 话 的 函数 talk with server 用 于 客户 端 ,而 process request 用 于 服务 


图 12.4 时 间 服 务 器 和 客户 端 版 本 1 
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器 端 。 

talk with server(fd) process request(fd) 

{ { 
char buf[ LEN]; time_t now; 
int n; char * cp; 

time (&now) ; 

n= read( fd, buf , LEN) ; Cp = ctime(&now) ; 
write(1,buf,n); write(fd,cp,strlen(cp)); 


) } 


服务 器 调用 time 从 内 核 中 获得 时 间 , 然 后 用 ctime 将 时 间 转 换 成 可 以 打印 的 字符 串 。 
服务 器 将 该 字符 串 写 到 socket 中 ,发送 给 客户 端的 socket。 客 户 从 socket 中 读 取 该 字符 串 ， 
然后 写 到 标准 输出 中 。 这 个 新 的 版 本 遵循 了 先前 版 本 的 程序 逻辑 ,但 是 设计 更 加 模块 化 , 代 
码 更 加 清晰 。 


12.4.2 第 2 版 的 服务 器 : 使 用 fork 


现在 考虑 第 二 版 服务 器 的 设计 。 第 二 版 中 程序 没有 通过 调用 time 函数 来 获得 代表 时 间 
的 数据 ,而 是 直接 使 用 了 一 个 shell 命令 (date 命令 ) ,如 图 12.5 所 示 。 


timed date 





图 12.5 服务 器 使 用 fork 运行 date 


代码 如 下 : 


process request(fd) 
/* 
* send the date out to the client via fd 
x/ 
{ 
int pid = fork() ; 


switch( pid) 
{ 
case —1;return; /* can not provide service */ 
case 0;dup2(fd,1); /* child runs date «/ 
close(fd); /* by redirecting stdout x/ 


execl("/bin/date", "date", NULL) ; 


oops( "execlp"); . /* or quits «/ 
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default, wait(NULL); /* parent wait for child x/ 


t 


如 图 12.5 Stas, ARS ee fork 建立 一 个 新 的 子 进程 。 该 子 进程 将 标准 输出 重 定向 到 
socket. 然后 运行 date, date 命令 给 出 口 期 ,然后 将 日 期 写 到 标准 输出 ,这 样 就 把 字符 串 发 送 
到 窜 户 回 了 。 在 程序 中 调用 了 wait, shell 通常 在 调用 fork 后 要 调用 wait, Ob Aix E H HH 
有 意义 吗 ? 本 文 将 在 下 一 节 中 探讨 该 问题 。 


12.4.3 服务 器 的 设计 问题 : DIY 或 代理 


这 里 使 用 了 两 种 服务 器 的 设计 方法 : 

* 自己 做 (Do It Yourself, DIY) sR MB. Aca AE. 

+ 代理 一 服务 器 接收 请 求 , 然 后 创建 一 个 新 进程 来 处 理工 作 ， 

每 种 方法 的 优 缺 点 各 是 什么 ? 

* 自己 做 用 寺 快 速 简单 的 任务 

计算 当前 的 日 期 和 时 间 需 要 系统 调用 time MERA cime, EH] fork 和 exec 来 运行 


























化 日 已 来 完成 工作 并 且 在 listen 中 限制 连接 队列 的 大 小 。 文 件 socklib. c 中 的 make server - 
socket q 函数 以 队列 大 小 作为 参数 。 

* 代理 用 于 慢 速 的 更 加 复兴 的 任务 

服务 器 处 理 耗 时 的 什 务 或 等 待 资源 时 ,需要 代理 来 完成 其 工作 。 这 就 像 商务 中 的 电话 
接线 员 ,接收 电话 ,把 连接 传递 到 下 一 个 销售 或 服务 人 员 ,然后 再 回 过 去 接收 下 一 个 电话 ,而 
服务 器 可 以 使 用 fork 创建 一 个 新 进程 来 处 理 每 个 请 求 。 通 过 这 种 方式 ,服务 器 加 以 同时 处 
理 多 个 任务 。 

* 使 用 SIGCHLD MEEF (zombie) 问题 

除了 等 待 子 进程 死亡 外 , 父 进程 可 以 设置 为 接收 表 永 子 进 程 死亡 的 信号 。 第 8 章 中 解释 
了 当 子 进程 退出 或 被 终止 时 ,内 核发 送 SIGCHLD 给 父 进程 。 但 它 不 同 于 本 文 讨 论 的 其 他 信 
号 ,默认 时 SIGCHLD 是 被 忽略 的 。 父 进程 可 以 为 SIGCHLD 设置 一 个 信和 号 处 理 画 数 , 它 吕 
以 调用 wait。 具 体 方法 如 下 : 








/* naive use of SIGCHLD handler with wait() - buggy */ 
main() 
{ 
int sock, fd; 
void child _waiter(int) , process_request( int); 
signal(SIGCHLD child waiter); 
if((sock- make server socket(PORTNUM))* = - 1) 
oops("make server socket"): 
} 
whileti1) ! 
fd- accept( sock, NULL, NULL) ; 
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iftfd== -1) 
break; 
process request( fd}; 
close(fd) ; 


1 
『 

1 

1 


void child waiter(int signum) 


waittNULL); 
} 
void process request(int fd) 
{ 


if{forkt) == 0) | /* child #/ 
dup2¢fd,1}; /* moves socket to fd 1 «/ 
close( fed); ^* closes socket */ 


execlp("data", "date", NUII); /x exec date &/ 


oops("execlp date"); 
} 
} 


PF Ra OTR PAME. SPAR ORIN. SERRE fork. fS OC XIERRO ED 
返回 去 接收 下 一 个 请 求 ,让 子 进程 去 处 理 请 求 。 当 子 进程 退出 时 , 父 进 程 收 到 SIGCHLD fà 
导 , 跳 利 处 理 函 数 并 调用 wait。 子 进程 从 进程 宕 中 被 删除 , 父 进程 从 椒 理 函 数 返 回 到 主 函 
数 。 该 过 程 看 上 去 似乎 很 完美 了 ,不 过 其 中 存在 着 两 个 问题 。 

问题 1 RRR ie FT Bl fis Ab Se Be e+ SETA A accept。 当 accept 被 信和 号 
中 断 时 ,返回 一 1, 然 后 设置 errno 8| EINTR。 代 码 中 把 accept 返回 的 一 1 作为 错误 ,然后 从 
主 循 环 中 跳出 来 。 这 里 需要 更 改 main 函数 来 区 分 真正 的 错误 和 被 打 断 的 系统 调用 所 产生 
的 错误 。 这 个 作为 练习 ,由 读者 完成 ， 

问题 2 关于 Unix 是 如 何 处 理 多 个 信号 的 。 如 果 多 个 子 进程 几乎 税 时 退出 ,将 会 发 生 
TA? 假设 同时 有 3 个 SIGCHLD 发 送 到 父 进 程 。 最 先 到 达 的 信和 号 导致 从 进程 中 到 处 理 蚂 
数 , 然 后 父 进程 调用 wait 来 保证 子 进程 已 经 从 进程 表 中 删除 。 这 样 就 可 以 了 吗 ? 

当 父 进程 在 运行 舍 导 处 理 函 数 时 ,其 他 两 个 信号 的 到 达 导 致 Unix 限 塞 ,但 是 并 不 缓存 
信号 。 从 而 ,第 二 个 信号 被 姐 赛 ,而 第 二 个 信和 号 丢失 了 。 此 时 ,如 果 还 有 其 他 的 子 进程 退出 ， 
来 自 于 这 些 子 进程 的 信号 也 将 天 失 。 信 和 号 处 理 晒 数 只 调用 了 wait 一 次 ,所 以 每 次 丢失 一 个 
信号 意味 着 少 调用 了 -次 wait. BO ESE (zombie), MAAK EAR 
中 调用 wait 足够 多 的 次 数 来 去 除 所 有 的 终止 进程 。waitpid 消 数 解决 了 此 问题 ， 














void child waitertint signum) 


了 
1 


while(waitpidti - 1,NULL,WNOHANG) 0); 
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waitpid 提供 了 wait 函数 超 集 的 功能 。 其 第 一 个 参数 表示 它 所 要 等 待 的 进程 ID 号 。 值 
-1 表示 等 待 所 有 的 子 进 程 。 第 二 个 参数 是 指向 整 型 值 的 指针 ,用 来 获取 状态 。 服 务 器 并 不 
关心 子 进程 中 发 生 了 什么 ,不 过 一 个 健壮 的 服务 器 可 能 用 该 信息 来 跟踪 错误 。 

waitpid 的 最 后 一 个 参数 表示 选项 ， WNOHANG 参数 告诉 waitpid: 如 果 没 有 僵尸 进 
程 , 则 不 必 等 待 。 

该 循环 直到 所 有 退出 的 子 进程 都 被 等 待 了 才 停 止 。 即 使 多 个 子 进程 同时 退出 并 产生 了 
多 个 SIGCHLD, 所 有 的 这 些 信 号 都 会 被 处 理 。 


12.5 编写 Web 服务 器 


至 此 ,已 经 学 习 了 编写 Web 服务 器 的 必 备 知识 。Web 服务 器 是 已 经 编写 的 目录 服务 器 
的 扩展 。 主 要 的 扩展 是 一 个 cat 服务 器 和 一 个 exec 服务 器 。 


12.5.1 Web 服务 器 功能 


Web 服务 器 通常 要 具备 3 种 用 户 操作 : 
(D 列举 目录 信息 ， 

(2) cat 文件 。 

(3) 运行 程序 。 


- 台 web 服务 器 

1. 运行 程序 
| | | 2. 显示 文件 

Ie LAE Thal IITUPUCDE I] 3. 显示 目录 





mnm 


12.6 Web 服务 器 提供 远程 Is. cat, exec 


Web 服务 器 通过 基于 流 的 socket 连接 为 客户 提供 上 述 3 种 操作 。 如 图 12.6 所 示 ,用 户 
连接 到 服务 器 后 ,发 送 请 求 ,然后 服务 器 返回 客户 请 求 的 信息 。 具 体 过 程 如 下 : 


客户 端 : 服务 器 端 : 

用 户 选 择 一 个 链接 

连接 服务 器 ”一 接收 请 求 

写 请 求 读 取 请 求 
处 理 请 求 : 


目录 :显示 目录 列表 

文件 :显示 内 容 

. cgi 文件 :运行 

不 存在 : 错误 消息 
读 取 应 答 € 写 应 答 
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挂 断 

显示 应 管 
html ; S£ f 
image: £& Bi 
sound: iz ff 


重复 ~ 
12.5.2 设计 Web 服务 器 


有 所 要 编写 的 操作 如 下 ，。 

CD 建立 服务 器 

可 以 使 用 socklib. c 中 的 make server socket, 

(2) 接收 请 求 

使 用 accept 来 得 到 指向 客户 端的 文件 描述 符 。 可 以 使 用 Idopen 使 得 该 文件 描述 符 转 换 
成 缓冲 渡 。 

(3) 读 取 请 求 

什么 是 一 个 请 米 ? 客户 端 姐 何 请 求 服务 ”这 些 需要 进一步 学 习 。 

(4) 处 理 请 求 

已 经 知道 了 如 何 列 出 日 录入 息 、cat 文件 以 及 运行 程序 。 通 过 opendir Al readdir, open 
和 read dup? 和 exec 的 使 用 可 以 实现 上 述 功 能 。 

(50 发 送 应 管 

什么 是 一 个 应 答 ? 客户 端 期 待 接收 的 又 是 什么 ? 这 些 也 需要 进一步 好 学 习 。 至 此 ,已 
经 学 习 了 几乎 所 有 的 编写 Web 服务 器 的 知识 和 技能 , 所 剩 的 是 Web 服务 器 协议 的 学 习 。 


12,5.3 Web 服务 器 协议 


客户 端 (浏览 器 ) 与 Web 服务 器 之 间 的 交互 主要 包含 客户 的 请 求 和 服务 器 的 应答 。 请 求 
各 应 管 的 格式 在 超 文 本 传输 协议 (HTTP}) 中 有 定义 。HTTP 像 上 一 章 中 的 时 间 服 务 器 和 
finger 服务 器 的 协议 一 样 ,使 用 纯 文本 。 就 像 在 时 间 服 务 器 和 finger 服务 器 中 所 做 的 , 这 里 
可 以 使 用 telnet 和 Web ESERIA. Web 服务 器 在 端口 80 监听 。 下 面 是 一 个 实际 的 
例子 ， 




















$ telnet www, prenhall. com 80 
Trying 165.193.123.253... 
Connected to www. prenhall. com. 
Escape character is '^;'. 


GET /index, html HTTP/1. 0 


HTTP/1.1 200 OK 

Server, Netscape - Enterprise/3.6 SP3 
Date.Tue,22 Jan 2002 16.11.14 GMT 
Content - type: text/html 
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Last - madified.Fri, 08 Sep 2000 20.20.06 GMT 
Content — lenqth:327 
Accept 一 ranges, bytes 


Connection.close 


<I ETHE > <2 HEADS 

< META HTTE-EQUIV = "Refresh" CONTENT = "0; 
URL = http; // vig. prenhall. com/ "> 

<< HRAD «ZBODYT < (BODY D> </HTML> 


= 1 一 一 =u 一 一 -一 一 一 一 一 一 一 一 一 一 一 -- 一 一 . CO m 
| 一 一 Caught you peeking! 一 - 人 


Connection closed hy foreign host. 


$ 


这 里 只 发 送 了 一 行 请 求 , 却 接收 了 多 行 返 占 。 知 道具 体 细节 吗 ? 

1. HTTP i; GET 

telnet 创建 了 一 个 socket 并 调用 了 connect 来 连接 到 Web 服务 器 ， 服务 器 接受 连接 请 
求 , 并 创建 了 一 个 基于 socket 的 从 客户 端的 键盘 到 Web 服务 进程 的 数据 通道 。 

接 下 来 , 输 人 请 求 : 


GET /index. htm! HTTP/1.0 


一 个 HTTP 请求 包含 有 3 个 字符 叫 。 第 一 个 字符 趾 是 命令 ,第 二 个 是 参数 ,第 三 个 是 所 
用 协议 的 版 本 号 ,在 该 例子 中 ,重用 了 GET 命令 ,以 index html 作为 参数 ,使 用 了 HTTP 
版 本 1.0, 

HTTP 还 包含 儿 个 其 他 的 命令 。 大 部 分 Web 请 求 使 用 GET, 因 为 大 部 分 时 间 中 用 户 是 
单 击 链接 来 获取 网 页 。GET 命令 可 以 跟 几 行 参数 。 这 里 使 用 了 简单 的 请 求 ,以 一 个 空 行 来 
表示 参数 的 结束 ,并 使 用 与 本 书 前 面 提 及 的 关于 shell 的 相同 约定 。 实 际 上 ,一 个 Web 服务 
w REE T cat 和 1s 的 Unix shell, 

2. HTTP & €-; OK 

服务 器 读 取 请 求 ,检查 请 求 ,然后 返回 一 个 请 求 。 应 答 有 两 部 分 ; 头 部 和 内 容 。 头 部 以 
状态 行 起 始 , 如 下 所 示 ， 


HTTP/1.1 200 OK 


VoStr SUE PIPER ERB.I TET BI p MEIST gd BE Oe 
是 200, 其 文本 的 解释 是 O 肛 。 这 里 请 求 的 文件 叫 /info. html, 而 服务 器 给 出 应 答 表示 可 以 
得 到 该 文件 。 如 果 服 务 器 中 没有 所 请 求 的 文件 名 ,返回 码 将 是 404, 其 解释 将 是 “未 找到 ”. 

头 部 的 其 余部 分 是 关于 应 答 的 附加 信息 。 丰 该 例子 中 ,附加 信息 包含 服务 器 名 .应 答 时 
间 、 服 务 器 所 发 送 数 据 类 型 以 及 应 管 的 连接 类 型 。 一 -个 应 管 头 部 可 以 包 合 有 多 行 信息 ,以 空 
行 表示 结束 ; 空 行 位 于 Connection:close 上 后面 。 

应 答 的 其 余部 分 是 返回 的 具体 内 容 。 这 里 ,服务 器 返回 了 文件 /index. html 的 内 容 。 
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3. HTTP 小 结 

f PRI web 服务 器 从 万 的 基本 结构 如 下 ， 

(1) 客户 发 送 请 求 

GET filename HTTP/ version 

可 选 参数 

RT 

(2) 服务 器 发 送 应 答 

HTTP/ version status-code status-message 

附加 信息 

空 行 

内 容 

协议 的 完整 描述 可 以 参阅 网 上 的 版 本 1.0 的 RFC1945 和 版 本 1. 1 的 RFC2068, 

Web 服务 器 必须 接收 客户 的 HTTP 请 求 , 并 发 送 HTTP eS. PRAMS RA A 
格式 ,是 为 了 便于 使 用 CC 中 的 输入/ 输出 以 及 字符 串 丽 数 读 收 和 处 理 。 


12.5.4 编写 Web RSH 


BOR Web 服务 器 只 支持 GET 命令 ,只 接收 请 求 行 , 跳 过 其 余 参 数 , 然 后 处 埋 请 求 和 发 送 
应 管 ,主要 循环 如 下 ， 


while(1) 

i 
fd = accept {sock , NULL, NULL) ; /* take a call »/ 
fpin- fdopen(fd,"r"); /* make ita FILE* «/ 
fgets(fpin, request,LEN); /* read client request x/ 
read until crnl(fpimn; /* skip over arguments «/ 
process rq(request,fd); /* reply to client «/ 
fclose(fpin); /* hang up connection «/ 


} 


AP TE A TOR, 
l. 处 理 请 求 
处 理 请 求 包 合 识别 命令 和 根据 参数 进行 处 理 ， 


process rq( char * rg, int fd ) 
i 
char cmd[ 11], arg[ 513]; 


if (fork() {= 0) /* ifa child, do work »/ 


return; /* if parent return x/ 
sscanf(rq, "$ l0s/& 5125", cmd, arg); 


r 


if ( strempicmd, "GET") |= 0) /* check command */ 














第 12 章 连接 和 协议 , 编写 Web 服务 器 373 * 





cannot dotfdy; 





else if ( not existí( arg?) /* does the arq exist */ 
do_404(arg, fd); /* n, tell the user */ 
else if ( isadir( arg ) } /* is it a directory? x/ 
do ls( arg, fd}; /* y. list contents */ 
else if ( ends in cgi( arg ) ) /* name is X. cgi? */ 
do exec( arg, fd); fs y, execute it x/ 
else /* otherwise */ 
do cat( arg, fd}; /* display contents x/ 


t 


服务 器 为 每 个 请 求 创建 一 个 新 的 进程 来 寻 理 。 子 进程 将 请 求 分 割 成 命令 和 参数 。 如 果 
命令 不 是 GET, 服 务 器 应 答 HTTP 返回 码 表示 未 实现 的 命令 。 如 果 命 令 是 GET, 服 务 器 将 
期 望 得 到 目录 各 ,一 个 以 . cgi 结尾 的 可 执行 程序 或 交 件 各 。 如 此 没有 该 目录 或 指定 的 文件 
名 ,服务 句 报 错 。 

如 果 存 在 目录 或 文件 ,服务 器 决定 所 要 使 用 的 操作 : ls exec 或 cat, 

(2. BRAK BHM 
BE do ls 处 理 列 出 目录 信息 的 请 求 : 








do is(char x dir, int £d) 
i 


FILE + fp; 

fp = fdopen(fd,"#"); /* make socket into a FILE « «/ 
header(fp, "text/plain'2; {x send HTTP reply header +, 
fprintf(fp, "\r\n"); /* and end of header mark x/ 
fflush(fp); /* force to socket */ 

dup2(fd, 1); /* make socket stdout x/ 
dup2(fd,2); /* make socket stderr «/ 
close(fd); /* close socket #/ 


execl("/bin/ls","ls","- l",dir,NULL); /* ls - l does the work */ 
perror(dir); /* or it doesn't */ 
exit(1):; /* child exits «/ 


} 


这 时 没有 像 前 面 章节 中 的 目录 服务 … 样 使 用 popen, MAHA ls 命令 ,避免 了 客户 
ft] shell popen 传递 任意 字符 串 来 运行 的 问题 。 

3. Jb A C 

其 他 的 函数 和 包 合 在 本 章 的 后 面部 分 中 。 程 序 可 以 工作 ,但 它 并 不 完整 ,也 不 安全 。 需 要 
做 如 下 的 改进 : 

(1) APARER: 

(2) 缓存 洪 出 保护 
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(3) CGL Common Gateway Interface, 通 用 网 关 接 口 ) 程 序 需要 设置 一 些 环 境 变 基 ; 


(4) HTTP 头 部 可 以 包含 更 多 的 信息 。 
该 程序 是 一 个 包含 230 F CC 代码 的 完整 的 Web 服务 器 ,包含 注释 和 空 行 。 


12.5.5. 运行 Web 服务 器 
编 详 程序 , 企 革 个 端口 运行 它 : 


$ cc wabserv.c socklib.c - o webserv 


$ ./webserv 12345 

项 在 可 以 访问 Web ER 4 ZS, PLEA http: //yourhosiname:12342/. X html 文件 放 到 该 
H xt 3+ AY http: //yourhostname; 12345//filename. html 来 打开 它 。 创 建 下 面 的 shell 
BLA. 

B l /bin/sh 


F hello.cgi-a cheery cgi page 
printf "Content-type: text/plain\n\nhelio\n": 


将 它 命名 为 hello. cgi, Hi chmod 改变 权限 为 755, 然 后 用 浏览 器 调用 该 程序 : http;// 
yourhostname:12345/hello, cgi, 
12.5.6  Webserv 的 源 程序 

下 面 是 简单 Web 服务 器 的 代码 : 


/* webserv.c a minimal web server (version 0.2) 
* usage; ws portnumber 


x features; supports the GET command only 


* runs in the current directory 

* forks à new child to handle each request 

* has MAJOR security holes, for demo purposes only 
* has many other weaknesses, but is a good start 

* build; cc webserv.c socklib.c -o webserv 

xf 


include <Ustdio. hc 
finclude <Usys/types. hl 
# include -«sys/stat. ho 


E include «string. hz» 


main(int ac, char x av[] 
I 
1 

int sock, fd; 

FILE * fpin; 


char | request[BUFSIZ]; 
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if (Cac == 1)! 
fprintf(stderr, "usage, ws portnum\n") ; 
exit(1); 

} 


sock = make server socket( atoi(av[1] ); 


if ( sock == -1) exit(2); 
/* main loop here x/ 


while(1){ 
/* take a call and buffer it */ 
fd = accept( sock, NULL, NULL 5; 
fpin = fdopen(fd, "r" ); 


/* read request x/ 
fgets(request,BUFSIZ,fpin); 
printfí"got a call; request = $a", request); 


read til crnl(fpin); 


/* do what client asks x/ 


process rg(request, fd); 


fclose(fpin); 


read til crnl(FILE # } 


skip over all request info until a CRNL is seen 


read til crnl(FILE x fp) 
( 
char buf[BUFSIZ]; 


while fgets(buf,BUFSIZ,fp) |= NULL && strcmp(bof, Arin") J= 0); 





/* i 


process rg( char * rg, int fd) 

do what the request asks for and write reply to fd 
handles request in a new process 

rq is HTTP command, GET /foo/bar. html HTTP/1.0 





process rq( char * rq, int fd ) 
了 了 


char cmd[BUFSIZ|, arg BUFS12?, 


/* create a new process and return if not the child x/ 
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if ( fork() t= 0) 


return; 


strcpy(arg, "./"); /* precede args with ./ */ 


if ( sscanf(rg, "*€ s 9 s", cmd, arg t 2) t= 2) 


r 


return; 


if ( stremp(cmd, "GET") != 0 } 
cannot dof fd); 
else if ( not exist( arg ) ) 
do 404tarq, fd}; 
else if ( isadir( arg } ) 
do ls( arg, fd}; 
else if ( ends in cgi( arg} ) 
do exec( arg, fd}; 
else 
do cati arg, fd}; 





the reply header thing; all functions need one 


if content type is NULL then don't send content type 


header( FILE * fp, char * content type) 
{ 
fprintf(fp, "HTTP/1.0 200 OK\r\n"); 
if ( content type ) 
fprintf(fp, “Content-type; $ sXrXn", content type ); 


r 


FE 
simple functions first; 
cannot do(fd) vninplemented HTTP command 


and do_404¢ item, fd) no such object 


cannot do(int fd) 


J 
1 


FILE «fp = fdopen(fd,"w"), 


fprintf(fp, "HTTP/?.0 501 Not Implemented r\n"); 
fprintf(fp, "Content- type; text,plain\r\n"} ; 
fprintf(fp, "M r\n"); 


fprintf(fp, "That command is not yet implemented r\n"); 
fclose(fp); 
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do 404(char s» item, int fd) 
{ 
FILE x fp = fdopen(fd,"w"); 


fprintf(fp, "HTTP/1.0 404 Not Found\r\n">; 
fprintf(fp, "Content - type; text/plain\r\n"); 
fprintf(fp, "rin"; 


fprintf(fp, "The item you requested; $ s\r\nis not foundVrAn", 
fclose( fp) ; 


the directory listing section 
isadir() uses stat, not exist() uses stat 


do ls runs ls. It should nat 


item); 





isadir(char * fJ 
i 
struct stat info; 


return ( stat(f, info} [= - 1 && 5 ISDIR(info.st mode) ); 


not exist(char * f) 


rf 
1 


struct stat info; 


return( stat(f,&info) == -1 }; 


do ls(char * dir, int fd) 
1 
FILE * fp; 


fp = fdopen(fd, "w"); 
header(fp, "text/piain"); 
fprintf(fp,"XrXn') ; 
fflush( fp}; 


dup2(fd,1); 

dup2(fd,2); 

close(fd); 

qxeclp("ls","lg"," 1" dir, NULL); 
perror(dir}, 

exit(1); 
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the cgi stuff, function to check extension and 


one to run the program. 





char * file type(char * f) 
/* returns 'extension' of file */ 
{ 
char * Cp; 
if ( (cp = strrchr(f, '.' )) |= NULL) 
return cp* 1; 


return ""- 


t 


ends in cgi(char * f) 
1 


return ( stremp( file type(i2, "cgi" ) == 03; 


t 


do exec( char x prog, int fd} 


1 
FILE * fp; 


fp = fdopen(fd, "w"); 
header(fp, NULL}; 
Eflush(£p) ; 

dup2(fd, 15; 

dup2(fd, 2); 

close( fd); 

exec] ( prog, prog, NULL); 


perror (prog) ; 





do_cat (filename, fd} 


sends back contents after a header 





do cat(char * f, int fd) 
{ 


char x extension = file type(f); 
char x content = "text/plain"; 
FILE * fpsock, * fpfile; 
int e; ° 
if ( stremp(extension,"html") == 0) 
content = "text/html". 


else if ( stronp(extension, "gif") == 0) 
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content = "image/gif"; 

else if ( stremp(extension, "jpg") == 0) 
content 一 "image/jpeg"; 

else if ( stremp(extension, "jpeg") == 0) 


content - "image/jpeg"; 


fpsock = fdopen(fd, "w"); 
fpfile = fopen( f , "r"}; 
if { tpsock [= NULL && fpfile f= NULL } 


i 
headert fpsock, content); 
tprintf(fpsock, "riai; 
whilet (c = gete(fpfile) ) 1= EOF) 

pute(c, fpsock); 

fclose(fpfile): 
fclose(fpsack) ; 

} 

exit(d); 

} 


12.5.7 比较 Web 服务 器 


Web 上 服务 器 允许 其 他 机 器 上 的 客户 得 到 上 虽 录 信息 . 读 取 文件 和 运行 程序 。 所 有 的 Web 
服务 器 都 要 完成 这 些 基 本 操作 IP AES HTTP 协议 。 

郑 么 服务 器 之 则 有 什么 区 别 呢 ? 有 的 服务 器 容易 配置 和 操作 ,有 的 提供 了 更 多 的 安全 
特征 ,有 的 则 快速 处 理 请 求 或 使 用 较 少 的 内 存 。 其 中 -个 重要 的 特征 是 服务 器 的 效率 问题 。 
服务 器 可 以 同时 处 理 多 少 个 请 求 ? 对 于 每 个 请 求 , 服 务 器 需要 多 少 系统 资源 ? 

本 书 的 Web 服务 器 对 于 每 个 请 求 都 创建 新 进程 来 处 理 。 这 是 最 高 效 的 方法 吗 ? 读 取 文 
件 和 目录 的 请 求 需要 较 长 的 时 间 , 所 以 服务 器 没有 必要 等 待 这 些 操 作 完 成 ,但 是 有 必要 用 一 
个 新 的 进程 吗 ? 

有 第 三 种 方法 可 以 同时 运行 多 个 操作 。 程 序 可 以 在 一 个 进程 中 运行 党 个 任务 ,这 可 通 
过 使 用 线程 (thread) 来 实现 。 在 后 面 的 章节 中 将 学 习 它 的 使 用 。 


小 结 
1 主要 内 容 
* 基于 socket 的 客户/ 服务 器 程序 遵循 :个 标准 和 框架， 服务 器 接收 和 处 地 请 求 ,客户 发 


* 服务 器 建立 服务 器 端 socket。 服 务 器 端 socket 有 具体 的 地 ,用 来 接收 连 毛 。 
， 客户 创建 和 梧 用 客户 端 socket。 客 户 并 不 甘心 客户 端 socket 的 地 址 。 
* 服务 器 可 以 用 两 种 方法 之 -- 处 理 请 求 : 自己 处 理 请 求 , 或 使 用 fork 创建 新 进程 来 处 
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理 请 求 。 
* Web Hi + AiE ERAS XX GL HU EF socket 的 程序 。Web 服务 器 处 理 3 种 类型 的 请 求 : 
BCAA H se SU de Hind TRI. RAM SPA HTTP. 
2. F— P dE 2 
电话 呼叫 模型 不 是 客户 和 服务 器 通信 的 惟 -方式 ， 有 些 人 通过 邮件 发 送 定购 请 求 来 买 
商品 。 使 用 基于 消息 的 通信 系统 ,每 个 网 物 者 可 以 一 次 处 理 多 个 商店 的 购物 ,而 商店 可 以 同 
时 处 理 多 个 顾客 的 请 求 。 在 下 一 章 中 ,将 学 习 使 用 明信片 模型 的 网 络 编程 : 数据 报 
(Datagram) socket, 
3. 习题 
12.1 在 时 间 服 务 的 例子 中 洞 用 了 read 和 write 一 次 。 如 果 服 务 器 端 发 送 过 来 的 数据 
分 儿 次 到 达 或 超出 缓存 的 大 小 将 会 怎样 ?如 果 客 户 端 需要 多 次 调用 read, 该 如 
何 修改 ? 在 服务 器 端 ,write 的 返回 值 小 于 字符 申 的 长 讼 ,又 会 怎样 ? 


12.2 修订 版 的 SIGCHLD BG AP BB P Zt FE HE. waitpid 和 -个 循环 。 那么 可 以 在 一 个 御 
环 中 使 用 常规 的 wait 来 处 理 多 个 信号 问题 吗 ? 





























4. 编程 练习 
12.3 改写 本 章 中 的 一 般 服务 器 模型 ,使 得 它 被 信号 中 断 时 ,可 以 重 起 调用 accept. 


12.4 改写 Web 服务 恬 , 使 得 它 保 留 所 有 请 求 和 返回 状态 的 日 志 信 息 。 


12.5 7j Web 服务 器 接收 CGI 程序 请 求 时 ,服务 器 将 设置 一 些 CGI EHE BU SRI S FR 
找 出 这些 环境 变量 ,并 把 其 中 的 一 些 加 到 Web 服务 器 中 。Shell 一 章 中 解释 了 如 
何 设置 环境 变量 。 


12.6 Web 服务 器 可 以 使 用 丙种 方法 米 识别 每 个 请 求 所 要 运行 的 程序 。 本 章 中 是 以 . 
cgi 作为 扩展 名 来 识别 要 运行 的 程序 。 汉 一 种 方法 是 使 用 路径。 特别 地 ,如 果 请 
求 的 路 径 中 包含 有 目录 名 cgi-bin, 该 程序 就 被 运行 。 例 如 ,对 于 /cgi-bin/counter 
的 请 求 在 该 系统 下 将 被 服务 器 执行 。 改 写 服 务 器 以 支持 这 种 方法 。 


12.7 改写 Web 服务 器 使 得 它 可 以 发 送 更 多 的 信息 。 书 中 例子 中 的 连接 给 出 了 典型 的 
头 部 项 的 集合 。 将 这 些 项 增加 到 Web 服务 器 中 ， 


12.8 改写 Web 服务 器 以 支持 HEAD IR. Wi HTTP 协议 获取 详细 信息 ， 
12.9 RE Web 服务 器 以 支持 POST 请 求 。 阅 读 HTTP 协议 获取 详细 信息 。 


5. 项 目 
基于 本 章 的 内 容 , 可 以 学 习 编 写 下 面 的 Unis 程序 ， 


httpd.telnetd,fingerd,ftpd 
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概念 与 技巧 

基于 数据 报 的 编程 ,数据 报 socket 
TCP 与 UDP 

许可 证 服务 器 

^ 软件 时 间 惟 (Software ticket) 
设计 健壮 系统 

设计 分 布 式 系统 

* Unix BREF socket 

相关 的 系统 调用 与 函数 


* socket 


* sendto,recvirom 


13.1 软件 控制 


程序 的 运行 需要 内 存 .CPU 和 一 些 系统 资源 。 操 作 系 统 关心 这 类 事情 ,但 是 一 些 程 序 还 
需要 关心 另 一 件 事 情 :, 就 是 程序 期 有 者 的 允许。 

从 合法 性 的 角度 讲 , 需 要 有 一 个 许可 证 (icense) 来 保证 程序 的 合法 运行 ,但 是 有 些许 可 
证 却 是 带 有 限制 的 。 例 如 ,有 的 许可 证 是 限制 同时 运行 程序 的 用 户 数 。 一 个 10 人 的 许可 证 
可 能 需要 一 定 的 花费 ,而 50 人 的 许可 证 可 能 需要 更 多 的 花费 。 有 些 厂 商 租赁 软件 许可 证 , 当 
租赁 期 到 了 ,程序 就 不 能 继续 运行 。 当 然 除了 合法 性 方面 之 外 ,软件 也 还 受到 其 他 一 些 因 素 
的 限制 。 学 校 里 的 计算 机 房 就 可 能 限制 每 天 游戏 程序 运行 的 次 数 。 

有 些 软 件 拥有 者 使 用 减 信 机 制 来 限制 程序 的 使 用 ,他 们 把 许可 证 条 款 打 印 在 屏幕 上 或 
纸 上 并 要 求 用 户 遵 守 协 约 。 其 他 的 则 使 用 特定 的 技术 来 实施 许可 证 条 款 。 





(Do 本 章 的 内 容 基 于 Lawrence deLuca 在 哈佛 职业 教育 蕉 院 担 性 助教 期 间 编 写 的 讲稿 ,该 讲稿 取材 于 他 大 与 开发 的 


一 个 产品 。 
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一 种 实施 许可 证 技术 是 编写 程序 来 执行 许可 证 控制 。 通常 的 做 法 是 设计 从 一 个 许可 证 
服务 器 获得 许可 的 应 用 程序 。 该 服务 器 是 个 进程 , 它 授 权 庶 用 程序 的 运行 。 
许可 证 服务 器 明确 许可 证 条 款 并 且 强 制 执 行 该 条 款 , 如 图 13.1 所 示 。 

















图 13,1 许可 证 服务 器 给 予 许可 


请 求 许可 和 给 予 许 可 需要 客户 和 许可 证 服务 器 之 间 的 通信 。 

许可 证 服务 器 是 如 何 工作 的 ? 木 章 将 学 习 一 个 其 体 的 客户 /服务 器 许可 证 控制 模型 。 
通过 该 模型 的 学 习 , 可 以 接触 到 另外 一 种 类 型 的 socket- 数据 报 socket, 另 外 的 一 个 地 址 
域 一 一 Unix 域 , 一 个 维持 系统 状态 的 网 络 协议 ,以 及 其 他 一 些 有 关 设 计 安全 健壮 的 客户 / 服 
务 器 系统 的 技术 。 





13.2 许可 证 控制 简 史 


软件 控制 技术 的 使 用 已 经 有 多 年 的 发 展 房 史 了 。 

在 单机 版 的 个 人 计算 机 时 代 , 对 软件 的 限制 是 靠 特 定 的 磁盘 或 由 隐匿 在 特定 磁道 上 的 
密码 来 实现 的 。 人 磁盘 十 的 密码 很 难 被 复制 ,并 且 只 有 磁盘 在 驱动 器 中 的 时 候 程 序 才 能 运行 。 
如 果 碰 盘 委 失 了 或 被 损坏 了 ,该 程序 将 不 能 再 运行 。 人 们 很 抉 就 破解 并 找到 了 如 何 来 复制 
这 种 特殊 磁 瘟 的 方法 ,所 以 软件 厂商 发 明了 硬件 密 钥 。 硬 件 密 钥 是 一 个 适配器 , 它 可 以 搬 在 
并 日 ,串口 或 USB 口上 ; 裤 许 可 的 穆 序 只 有 在 发 现 该 适配器 的 时 候 才 能 运行 。 姑 果 人 硬件 密 
9I X X ,程序 将 不 能 运行 。 

然而 网 络 计算 机 和 多 用 户 系统 却 引 起 了 新 的 问题 。 如 果 10 个 用 户 同时 想 运 行 计算 机 
或 网 络 上 的 同一 个 程序 ,那么 是 不 是 每 个 用 户 都 需要 在 服务 器 的 端口 上 插 一 个 硬件 密 铀 
Be? 软件 厂商 们 需要 一 种 可 靠 的 并 且 不 需要 给 合法 用 户 增加 额外 负担 的 方法 来 实施 许可 
证 条 款 。 

网 络 和 多 用 户 系统 提供 了 一 种 新 的 解决 方法 : 许可 证 服务 器 。 程 序 不 是 从 磁盘 或 密 铀 
取得 许可 ,而 是 从 服务 器 进程 取得 。 许 可 证 服务 器 被 一 台 计算 机 上 多 个 用 户 共 享 , 服 务 器 进 
程 能 够 控制 程序 的 使 用 人 数 、 使 用 时 间 、 使 用 地 点 甚至 程序 的 使 用 方式 。 伴 随 更 多 的 计算 机 
加 入 因特网 ,服务 器 控制 对 软件 和 数据 访问 的 需求 也 更 加 人 迫切。 

本 章 中 的 许可 证 服务 器 将 实施 x 用 户 的 限制 。 也 就 是 说 ,服务 器 只 允许 特定 数量 的 程序 
实例 同时 运行 。 
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13.3 ”一 个 非 计算 机 系统 实例 : 轿车 管理 系统 


一 个 公司 购买 了 许可 证 ,该 许可 证 限制 了 同时 使 用 程序 的 用 户 数 。 公 司 可 能 拥有 比 许 
可 证 所 允许 的 用 户 要 多 的 雇员 ,但 是 并 非 所 有 的 雇员 要 同时 使 用 程序 。 怎 样 的 一 个 设计 才 
能 满足 上 面 的 需求 呢 ? 

现实 世界 中 有 很 多 系统 ,通常 由 一 大 群 人 来 共享 其 中 的 资源 ,而 这 些 资源 是 有 限 的 。 这 
里 将 分 析 一 个 模型 : 雇员 共享 公司 轿车 的 问题 。 一 个 公司 拥有 特定 数量 的 轿车 ,同时 还 拥有 
更 多 数量 的 和 雇员。 如何 控制 对 轿车 的 使 用 呢 ? 


13.3.1 轿车 钥匙 管理 描述 


控制 轿车 的 使 用 是 通过 控制 对 轿车 钥匙 的 访问 。 当 想 用 轿车 的 时 候 , 必 须 先 得 到 一 把 
钥匙 。 如 果 在 钥匙 盒 中 没有 钥匙 了 ,将 不 能 使 用 轿车 。 如 果 有 可 用 钥匙 ,可 以 先 拿 一 把 钥 
匙 ,签名 ,然后 使 用 轿车 。 使 用 完毕 后 ,把 钥匙 放 回 钥匙 盒 ,在 使 用 轿车 名 单 中 划 去 自己 的 名 
字 。 过 程 描述 如 图 13. 2 所 示 。 


司机 | 钥匙 管理 员 AER ” 一 定数 量 的 车 


| 
$^» gus 
o 





图 13.2 控制 对 轿车 的 的 使 用 


签名 列表 有 何 作用 呢 ? 该 系统 的 目的 是 通过 控制 对 轿车 的 使 用 ,使 得 可 用 的 钥匙 一 直 
很 充足 。 人 并 非 是 完美 的 ,有 时 司机 会 忘记 归还 钥匙 。 钥 匙 管理 员 可 以 根据 签名 列表 找到 
该 司机 ,确定 他 是 否 仍 在 使 用 车 。 

轿车 使 用 管理 系统 是 控制 软件 使 用 的 一 个 现实 模型 。 在 将 该 系统 转换 成 软件 系统 之 
前 ,需要 更 为 详细 地 描述 该 系统 。 

钥匙 管理 系统 的 构成 如 下 : 

(1) 钥匙 管理 中 心 的 地 点 一 一 到 哪儿 可 以 获得 钥匙 

(2) 钥匙 管 理 员 一 一 执行 策略 的 人 

(3) 钥匙 一 一 需要 得 到 的 东西 

(4) 签名 列表 一 一 保存 钥匙 和 找 回 钥匙 的 记录 


13.3.2 用 客户 /服务 器 方式 管理 轿车 





在 给 出 轿车 钥 是 管理 系统 的 构成 后 ,下 面 将 用 客户 /服务 器 语言 来 描述 该 系统 。 
(1) 服务 器 和 客户 
谁 是 服务 器 和 谁 是 客户 ?钥匙 管理 员 拥 有 司机 需要 的 钥匙 。 用 网 络 术 语 来 描述 ,钥匙 
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(2) 协议 

所 用 的 评议 是 什么 ? REMSS ETA? MEHER RHEA ERNES. 

。 获得 钥 是 

SP. 你 好 ,我 需要 一 把 钥匙 。 

AS: 这 里 只 有 5 号 钥匙 ,没有 别 的 销 匙 了 。 

* 归还 钥匙 

et; 我 已 经 用 好 5 SR. 

服务 器 : 谢谢 。 

(3) 通信 系统 

客户 和 服务 器 如 何 通信 ? 奔 该 系统 中 ,人 们 通过 对 话 来 传递 简单 信息 。 

(4) 数据 结 均 

司机 和 锁匙 管理 员 需 要 什么 样 的 数据 结构 呢 ? 钥匙 管理 员 保 留 一 个 用 户 签名 列表 ,一 
把 钥匙 对 应 列表 的 一 项 。 当 -…- 个 用 户 取 走 一 把 钥匙 ,钥匙 管理 员 在 该 项 记 下 用 户 的 名 字 , 当 
APH ARAN SRR NS CAA PRE. FRR HPSS OUR: 











. 签名 列表 
钥匙 + 司 机 
] adam(a sales 
2 
3 carol@ support 
4 





如 盯 在 得 名 列表 中 没有 司机 与 钠 是 号 对 应 ,家 示 该 乌 题 是 可 用 的 。 反 之 ,表示 不 可 用 ，。 


13.4 许可 证 管理 
本 节 将 钥匙 管理 系统 的 思想 运用 到 许可 证 管理 系统 小。 
13.4.1 许可 证 服务 系统 : 它 做 些 什 么 


图 13.3 描述 了 人 们 试图 运行 许可 证 程序 的 过 程 。 工 作 如 下 : 
(D HIP U 运行 被 许可 的 程序 了 ; 

(2) 程序 P 向 服务 器 S 请 求 运 行 许可 ; 

(3) 服务 器 检查 当前 运行 程序 P 的 用 户 数 ; 

C4) 如 果 上 限 末 达到 ,S 给 予 许可 ,程序 PET: 

(5) 如 果 达 到 上 上限,S 拒绝 许可 ,程序 P 告 诉 U 稍 后 再 试 。 
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多 个 用 户 被 许可 程序 。 许可 证 服务 器 





socket 


图 13.3 控制 软件 的 使 用 


许可 证 服务 系统 与 轿车 钥匙 服务 系统 稍 有 不 同 。 在 轿车 系统 中 ,司机 向 钥匙 管理 员 请 
求 许可 ; 而 在 这 里 ,程序 向 服务 器 请 求 许可 。 这 就 像 司机 请 求 轿车 ,而 轿车 向 钥匙 管理 员 请 
RAK. 

程序 的 创建 者 要 编写 所 有 的 程序 : 应 用 程序 和 服务 器 。 这 两 个 程序 作为 一 个 系统 。 服 
务 器 给 予 应 用 程序 运行 许可 和 实施 许可 证 条 款 。 如 果 许 可 证 服务 器 不 在 运行 ,应 用 程序 将 
得 不 到 许可 ,不 能 运行 。 

这 里 以 轿车 钥匙 服务 系统 作为 模型 进行 了 讨论 。 那 么 如 何 将 这 种 思想 运用 到 软件 系统 
中 呢 ? 被 许可 程序 如 何 从 服务 器 得 到 许可 ? 服务 器 如 何 给 予 许 可 ? 软件 系统 和 轿车 钥匙 系 
统 的 等 价 之 处 在 哪里 呢 ? 


13.4.2 许可 证 服务 系统 : 如 何 工作 


(1) 票据 模型 

钥匙 管理 员 负责 分 发 钥匙 ,许可 证 服务 器 发 布什 么 呢 ? 以 电影 院 和 棒球 场 为 例 , 付 钱 获 
得 进 场 许 可 ,然后 得 到 一 张 人 场 票据 。 与 此 类 似 , 这 里 的 许可 证 服务 器 发 布 的 是 数字 票据 。 
这 种 票据 又 是 什么 样子 的 呢 ? 客户 和 服务 器 交换 字符 串 , 所 以 票据 是 字符 串 ,其 格式 如 下 : 


pid.ticketnumber 例如 : 6589.3 


每 张 票据 包括 持 有 该 票据 进程 的 PID 以 及 票据 编号 。 在 票据 中 包含 PID 的 原因 其 实 就 
和 在 飞机 票 上 印 上 名 字 的 道理 是 一 样 的 。 票 据 中 的 PID 标识 票据 的 使 用 者 ,在 票据 丢失 时 ， 
可 以 帮助 找 回 票 据 。 进 程 可 能 丢失 票据 吗 ? 

(2) 服务 器 和 客户 

谁 是 客户 和 谁 是 服务 器 ? 许可 证 服务 器 持 有 程序 需要 的 资源 : 票据 。 用 网 络 术语 ,许可 
证 服务 器 是 服务 器 ,而 应 用 程序 是 客户 。 

(3) 协议 

协议 是 什么 ? 交互 的 事务 是 什么 ? 这 里 的 票据 管理 协议 包括 下 面 的 两 个 主要 事务 : 


D 这 个 概念 并 不 难 理解 。 随 着 设备 越 来 越 先进 ,连接 越 来 越 方便 ,很 可 能 在 不 久 的 将 来 就 可 以 通过 你 的 收音 机 询问 
服务 器 是 否 有 播放 你 最 喜欢 歌曲 的 许可 。 
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* KR) AC 
ZF. HELO mypid 
服务 器 : TICK ticketid or FAIL no tickets 
« 上 归还 钥匙 
Berl, GBYE ticketid 
服务 器 ; THNX message 
这 里 定义 了 基于 文本 的 协议 ,协议 中 使 用 了 4 个 字符 的 简单 命令 ,这 与 前 面 的 Web 服务 
器 所 用 的 命令 类 似 。 
(4) 通信 系统 
上 述 简短 的 文本 信息 如 何在 客户 和 服务 器 之 间 传 送 y 在 本 文 后 面 将 讨论 该 问题 。 
CO 数据 结构 
客户 和 服务 器 之 问 所 用 的 数据 结构 是 什么 ”这 里 使 用 整 型 数组 作为 签名 州 表 。 数 组 的 
得 个 入 口 对 应 一 张 票 据 。 当 个 客户 取 由 了 一 张 迷 ,管理 员 将 客 族 对 应 的 PID SARA. 


WFE: 




















签名 列表 
o tick + MM process 7 
E 1 1234 
2 ü 
3 6589 
fh 


4 
MRA PRATER RAE 0. RA RRA, HH) ,表明 该 票据 正在 被 使 用 。 


13.4.3 一 个 通信 系统 的 例子 


客 岂 如何 请 求 票据 ? 服务 器 如何 发 布 票据 9? 这 涉及 到 进程 间 的 通信 形式 。 客 户 和 服务 
器 之 问 通 过 知 消息 通信 。 服 务 器 必须 接收 ,处 理 和 上 应答 米 自 多 个 客户 的 请 求 。 目 前 ,哪些 技 
术 是 可 以 使 用 的 呢 ? 本 文 前 面 学 习 的 信号 和 管道 机 制 可 以 考虑 ,但 基 信 号 太 短 了 ,而 管道 只 
连接 相关 联 的 进程 。 所 以 ,使 用 socket 是 最 明显 的 答案 ， 而 对 于 socket,; 也 有 两 种 不 同 的 选 
HE. -种 是 基于 流 的 socket, 它 是 用 来 连接 不 相关 的 进程 的 。 另 一 种 socket 被 称 为 数据 报 
socket s Eg Jy. UDP, 对 于 现在 的 项 ,这 种 socket 是 更 好 的 选择 ， 


13.5 数据 报 socket 


Bit socket 传送 数据 就 践 电话 网 中 传送 声音 一 样 ,客户 先 建 立 连 接 ,然后 使 用 该 连接 进行 
单身 ,双向 或 类 伺 管 道 的 字 节 流传 送 。 

数据 报道 信和 则 与 从 一 个 邮箱 到 另 - -个 邮箱 发 送 包 庄 类 似 。 客 让 不 必 建 立 连 接 , 只 览 向 
特定 的 地 址 发 送 消息 ,而 服务 器 进程 在 该 地 址 接收 消息 。 : 
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流 socket 使 用 的 网 络 协议 叫 TCP 即 传输 控制 协议 (Transmission Control Protocol) , 
数据 报 socket n] UDP 即 用 户 数据 报 协议 (User Datagram Protocol) 。 它 们 的 区 别 是 什么 
WE? 何 时 选择 何 种 socket 是 较 好 的 呢 ? 在 程序 中 如 何 使 用 数据 报 socket 呢 ? 


13.5.1 流 与 数据 报 的 比较 


socket 是 如 何 工作 的 ? 数据 如 何在 Internet 上 传输 的 ? 当 用 户 向 流 socket 写 数据 时 ;内 
核 要 做 些 什么 ? 这 与 向 数据 报 socket 写 数据 有 何 区 别 ? 

从 一 个 流 socket 传输 到 另 一 个 流 socket 的 数据 流 , 看 上 去 是 连续 的 ,无 颖 的 ,实际 上 这 
是 一 种 错觉 。Internet 连接 要 把 数据 分 割 成 独立 的 数据 包 。 网 络 数据 传输 过 程 如 图 13. 4 
BER 





图 13.4 Internet 包 传 载 数据 


在 现实 世界 中 ,有 很 多 将 一 大 块 数据 分 割 成 若干 较 小 的 数据 块 的 例子 。 假 设 要 通过 快 
递 传送 100 页 的 文档 。 当 快递 公司 要 求 你 使 用 只 能 装 20 页 的 信封 时 ,该 怎么 办 ?可 以 把 文 
档 分 割 成 5 个 包 惠 ,每 个 单独 地 打包 和 附 上 地 址 。 然 后 把 这 5 个 独立 的 包 豪放 到 邮箱 中 , 运 
输 系统 将 负责 把 它们 送 到 目的 地 。 在 接收 端 ,接受 者 打开 这 5 个 包 右 ,并 把 它们 按 顺序 重组 
成 原来 的 文档 。 

Internet 就 像 上 述 运输 系统 一 样 , 它 上 面 传输 的 数据 必须 符合 大 小 的 限制 。 大 块 的 数据 
被 分 割 成 小 块 的 数据 来 传输 ,接收 端 必须 以 正确 的 顺序 重组 数据 块 。 但 通信 过 程 可 以 被 连 
接 和 中 断 , 如 图 13. 5 所 示 。 








图 13.5 通信 可 以 被 连接 和 中 断 


流 socket 负责 分 割 .排序 .重组 的 所 有 工作 。 数 据 报 socket 则 不 会 。 下 表 给 出 了 它们 之 
间 的 区 别 。 
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TCP UDP 

at 数据 报 i 
分 片 /重组 否 

排序 5 

"TA 9 可 能 未 到 这 

连接 的 多 个 发 送 者 


在 流 socket 中 ,内 核 将 大 的 数据 块 分 割 成 带 编号 的 数据 片 。 位 于 接收 机 器 上 的 内 核 按 
顺序 接收 数据 片 ,重组 成 发 送 者 所 发 送 的 原始 数据 。 在 数据 报 Socket 中 ， 内 核 并 不 给 数据 加 
编号 标签 ， 在 目的 地 也 个 重组 。 

流 socket 对 传送 负责 ,数据 报 socket 则 不 。 流 socket 的 接收 器 检查 数据 片 的 顺序 来 确 
RUE CE BA. TEMES RAE ROMS HERRERA, H 
据 报 socket JE MAE RBA TEREE., MRRP GL EA A Internet H, ERER 
Bix, FCP E UDP 做 更 多 的 工作 。UPP 更 快 .更 简单 ,给 网 络 较 少 的 负荷 。 

UDP 接收 消息 女 邮 箱 系统 方式 相同 : 发 送 者 将 你 的 地 址 写 在 信件 上 ,邮件 系统 负责 将 
信件 送 到 你 的 邮箱 中 ,然后 你 从 邮箱 中 取出 信 。TCP socket 需要 明确 调用 accept, read 和 
close 来 读 取 远 端 进程 的 消息 。 

UDP 在 好 适合 这 里 的 应 用 。 客 户 发 送 短 消息 来 获得 许可 ,服务 器 发 送 短 消息 给 予 或 拒 
Hit. 客户 和 服务 器 的 交手 不 需要 建立 连接 ,不 需要 分 片 和 重 给。 五 可 靠 性 甚至 是 不 要 的 。 
如 果 请 求 或 票据 香 失 ,客户 可 以 再 次 请 求 。 在 任何 事件 中 ,服务 器 和 客户 就 像 在 一 台 各 器 上 
或 者 --- 个 网 络 的 同一 部 分 ,所 以 丢失 数据 报 的 风险 较 小 。 

UDP 对 于 Web 服务 器 和 e-mail 服务 是 -… 个 较 差 的 选择 。Web 服务 器 和 e-mail 信息 可 
能 是 大 的 文件 ,这 些 字 闻 流 必 须 完全 和 按 序 到 达 目 的 地 。UDP 对 于 人 允许 丢失 帧 的 声音 和 视 
频 流 是 较 好 的 选择 。 


13.5.2 数据 报 编程 


数据 报 与 邮件 网 络 系统 类 似 , 和 包括 3 个 主要 部 分 ; 目的 地 址 .返回 地 址 和 消息 ,如 图 13.6 
所 示 。 
































| sender |destination| data | 





图 13.6 数据 报 的 3 部 分 


数据 报 socket 可 以 被 理解 成 个 内 部 大 数据 的 盒子 ,发 送 省 给 出 日 的 socket 的 地 址 。 
网 络 将 数据 从 发 送 者 发 送 到 日 的 socket。 接 收 进程 从 该 socket 中 读 取 数 据 。 程序 使 用 
sendto 发 送 数 据 和 recvirom 来 读 取 数据 ,如 网 13.7 Bros. 
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一 台 主 机 可 能 有 多 个 接收 socket, A socket 被 指派 给 
一 个 特定 的 端口 号 。 地 址 用 主机 上 的 端口 来 区 分 。 


13.7 使 用 sendto 和 recvfrom 


1. 接收 数据 报 
程序 dgrecv. c 是 一 个 简单 的 基于 数据 报 的 服务 器 。dgrecv.c 使 用 命令 行 传 过 来 的 端口 
号 建立 socket, 然 后 进入 循环 ,接收 和 打印 从 客户 端 发 来 的 数据 报 : 


ee EEEE E EE E E E E a | 


* dgrecv.c — datagram receiver | 


* usage; dgrecv portnum 
.* action; listens at the specfied port and reports messages 
*/ 


# include <stdio.h> 

# include <stdlib.h> 

# include <sys/types.h> 
# include <sys/socket. h> 
# include <netinet/in. h> 


# define oops(m,x) ( perror(m) ;exit(x) ;} 


int make dgram server socket(int); 
int get internet address(char x , int, int * , struct sockaddr in x); 
void say who called(struct sockaddr in * ); 


int main(int ac, char * av[]) 


{ 


int port; /* use this port */ 

int sock; /* for this socket «/ 

char buf[ BUFSIZ]; /* to receive data here */ 

size t msglen; /* store its length here */ 
struct sockaddr in saddr; /* put sender's address here */ 
socklen t saddrlen; /* and its length here x/ 


if (ac == 1 || (port = atoi(av[1])) <= 0){ 


fprintf(stderr, "usage; dgrecv portnumber\n") ; 
exit(1); 
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/* get a socket and assign it a-port number */ 


if( (sock = make dgram server socket(port)) == -1) 


oops( "cannot make socket", 2); 
/* receive messaages on that socket x/ 


saddrlen = sizeof(saddr); 
while( (msglen = recvfrom(sock, buf ,BUFSIZ,0,&saddr gsaddrlen)) 7-0 ) 


buf[msglenl = '\a'; 
printfi"dgrecv, got a message; & s\n", buf); 
say who called(&saddr); 


1 


return 0; 


void say who called(struct sockaddr in « addrp) 


i 
char host[ BUPSIZ” > 


int port; 


get_internet_address(host , BUFSIZ ,&port ,addrp) ; 
printf(" from; $ 5, d\n", host, port}; 


辅助 函数 make dgram server socket 和 get internet. address 将 在 后 面 给 出 的 XT dgram. c 
中 定义 。 在 数据 报 socket 中 接收 消息 比 从 流 socket 接收 简单 。recvirom 函数 阻塞 言 到 数据 报 
到 达 。 当 数据 报到 达 时 ,消息 内 容 , 返 廿 地 址 和 其 长 度 将 被 复制 到 缓存 中 。 

2. 发 送 数 据 报 

程序 dgsend. c 发 送 数据 报 。dgsend, c 创建 一 个 socket, 然 后 用 它 发 送 消息 到 以 命令 行 
参数 传 入 的 特定 的 主机 和 端口 号 。 








SRR ARERR ERR ERR E EX XX X X X Xo X X X *Xo Xo x XOX X X X RE X X X X X X Xo X RRR Xo X ^ X X X XX X OX x X* 


* dgsend.c > datagram sender 


* usage, dgsend hostname portnum "message" 
* action; sends message to hostname; portnum 
xf 


d include  «stdio. hlc 

# include <“stdlib. ho 
include <Csys/types. hi> 
iinclude <Csys/socket, hz 


i include  -«netinet/in, hz» 


# define oopstm,x) į perror(m);exit(x);! 
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int make dgram client socket(); 
int make internet address(char * ,int, struct sockaddr in «5; 


int main(int ac, char * av[ |) 
i 
人 


int sock; /* use this socket to send x/ 
char * msq; /* send this messag «/ 
struct  sockaddr in  saddr; /* put sender's address here */ 


if(ac l= 4)! 
fprintf(stderr, "usage. dgsend host port 'message'Xn') ; 
exit(1); 

} 

msg = aví3]; 


/* get a datagram socket x/ 


if( (sock = make dgram client socket()) == -1) 
oops("cannot make socket", 2); 


/* combine hostname and portnumber of destination into an address x/ 
make internet address(av[1], atoitav[2]D, &saddr) 
/* send a string through the socket to that address */ 


if ( sendto(sock, msg, strlen(msg), 0, &saddr,sizeof(saddr)) =-~ ~ 1) 
oops("sendto failed", 3); 


return 0; 





sendto pk UME a FE rp ES A Be Js SUFRE Hh B socket. 
3. $8 55 oh ae 
创建 socket 和 socket 地 址 的 细节 被 封装 在 dgram. c 中 ， 


HII rcc eT 
* dgram.c 
* support functions for datagram based programs 


x 


# include <stdio.h> 

# include <Cunistd. h> 
itinclude <Usys/types. h> 
3 include  «2sys/socket. h> 
i# include  «netinet/in. h> 
# include  —arpa/inet.hc 
f include <‘netdb. h> 

# include «string. h> 


# define HOSTLEN 256 
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int make internet address); 


int make dgram server socket(int portnum) 


i 


struct  sockaddr in saddr; /* build our address here */ 
char hostname|[ HOSTLEN]; ^ /* address x/ 
int BOCk id; /* the socket «/ 


Sock id = socket(PF INET, SOCK DGRAM, 0); /x get a socket +/ 


if( sock id == -1) return - 1; 
/** build address and bind it to socket «#* / 


gethostname( hostname, HOSTLEN): /* where am I ? x/ 


make internet address(hostname, portnum, &saddr); 


if( bind(sock id, (struct sockaddr # )&saddr, sizeof(saddr)) |= 0) 


return - 1; 


return sock id; 
} 
int make dgram client sockett) 
i 
return socket(PF INET, SOCK DGRAM, 0); 
} 


int make internet address(char * hostname, int port, struct sockaddr in * addrp) 
/* 
x constructor for an Internet socket address, uses hostname and port 
* (host, port) -> * addrp 
x/ 
{ 
struct hostent * hp; 


bzero( (void * )addrp, sizeof(struct sockaddr in)); 

hp = gethostbyname( hostname) ; 

if ( hp == NULL ) return - 1: 

beopy((void « )hp— >h addr, (void x )&addrp- > sin addr, hp- —h length); 
addrp- —sin port = htons(port); 

addrp- 7 sin family = AF INET; 

return D; 


} 


int get internet address(char # host, int len, int x portp, struct sockaddr_ in x addrp) 
fa 
* extracts host and port from an internet socket address 
+x addrp — >> Chost, port) 
x/ 
1 
strncpy(host, inet ntoa(addrp- sin addr), len); 
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* portp = ntohs(addrp- >>sin port); 
return 0; 


) 


创建 一 个 数据 报 socket 与 创建 一 个 流 socket 类 似 。 其 不 同 点 在于 ,这 里 设置 socket 的 
类 型 为 SOCK_PGRAM, 而 且 不 要 调用 listen EX. 

4， 编 评 和 测试 

$ ccdgrecv.c dgram.c - o dgrecv 

$ ./dgrecy 4444& 

[1] 19383 

$ cc dgsend.c dqram.c ~ o desend 

$ ./dgsend host? 4444 "testing 123" 

dgrecv;gok a message, testing 123 

from,10.200.75.200.1041 

$ ps 

PID TIY TIME CMD 

145998 pts/3 00,00,00 bash 

19383 pts/3 00,00,00 dgrecv 

19393 pts/3 00,00,00 ps 

$ 


编译 服务 器 ,并 局 动 它 , 使 得 它 监听 在 端口 4444。 然 后 编译 和 运行 客户 ,使 客户 发 送 字 
符 串 到 端口 4444。 服 务 器 接收 消息 ,打印 消息 ,并 且 打 印 消息 的 返回 地 址 。 客 户 socket 拥有 
主机 地 址 和 端口 号 , 内核 随机 地 给 它 分 配 了 -- 个 端口 号 1041。ps 进程 显示 了 服务 器 正在 


运行 。 





13.5.3 sendto 和 recvfrom 的 小 结 


























sendto 
目标 | M socket 发 送 消息 
3X x dt # include «sys/types. h> 
H include e sys/socket. k> 
ae m nchars = sendio(int socket, const void * msg, size_t len, int flags, const struct 
sockaddr * dest,socklen_1 dest len); 
参数 socket socket id 
msg ARMS AAS HRA 
len 发 送 的 字符 数 
flags 比特 的 集合 ,设置 发 送 属性 ,0 表示 普通 
dest 指向 和 远 端 socket 地 址 的 指针 
dest len Hik BE 
i& [n] ff 一 1 遇 到 错误 


nchars 发 送 的 字符 数 
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sendto 从 源 socket 发 送 数据 报到 日 的 socket。 前 3 个 参数 与 write 的 参数 类 似 : BAR 
的 socket .保存 要 发 送 字符 串 的 数组 以 及 发 送 的 字符 数 。 与 write 类 似 ,sendto 返回 实际 发 
送 的 字符 数 。flags SRW REM SAUTE: 具体 可 参见 Unix 版 本 的 帮助 信息 。 最 后 两 
个 参数 给 出 发 送 呈 的 地 的 socket Mkt. MRE Internet 类 型 的 地 址 ,socket 地 址 包含 目的 主 
机 的 IP 地 址 和 端口 号 ,而 其 他 类 型 的 地 址 则 包含 其 他 的 成 员 。 

















reevfrom . 
目标 从 socket 接收 消息 
3X xd t include «sys/types, h> 
£ include «sys/sockct. hz g ! | 
[ES ES nchars = recvfrom(int socket. const void. * msg. size tlen, int flags, const struct 
sockaddr * sender,socklen t » sender len); 
#4 socket socket id 
msg 字符 类 型 的 数组 
len 接收 的 字符 数 
flags 表示 接收 属性 的 比特 的 集合 ,0 dm dod 


sender 指向 运 端 socket 的 地 址 的 指针 
sender len hb 





返回 值 1 "TIS - 
nrhars 接收 的 字符 数 





reevirom 从 socket 读 取 数据 报 。 前 3 个 参数 与 read 类 似 : 所 要 读 取 的 socket. FRE 
符 的 数组 以 及 要 读 取 的 字符 数 。 与 read 类 伺 ,recvfrom 返回 实际 接收 的 字符 数 ，flags dE (B 
了 接收 时 所 用 的 各 种 属性 ; 具体 可 参见 Unix 系统 的 帮助 信息 。 通 过 最 后 两 个 参数 ,可 以 获 
得 发 送 者 的 地 址 。 发 送 socket 的 地 址 将 被 存放 在 由 第 一 个 参数 指向 的 结构 中 ,地 址 长 度 存 
放 在 由 第 二 个 参数 指向 的 条 型 值 中 。 地 址 的 长 度 必 须 提供 给 recvlrom 函数 ; 如 果实 际 的 地 
址 是 不 同 欧 长 度 , 它 将 更 下 该 值 。 如 果 第 一 个 贿 数 指针 为 空 值 ,发 送 者 地 址 将 不 被 记录 。 


13.5.4 数据 报应 答 

程序 dgsend. c 和 dgrecv. c 显示 了 如 和 何以 客 户 发 送 数 据 络 服务 器 。 服务 器 如 何 给 客户 
Sk SVE? 在 现实 世界 中 ,假设 有 人 给 你 发 送 了 一 封 晚 富 的 邀请 函 , 你 将 如 和 何 给 出 答复 呢 ? 
这 很 简单 : 你 只 要 给 邀请 本 上 的 返回 地 址 网 信和 就 行 了 。 

程序 dgrecv2.c 从 客户 处 接收 消息 并 且 发 送 谢 谢 作为 应 答 





JYGRORON EMDR ERE MRE RARER REM TERRA E HEM RRR EX EORR OE XX EX X KE XXX 


* dgrecv2.c — datagram receiver 


* usage, dgrecv portnum 
* action; receives messages, prints them, sends reply 
xf 


# include =<stdio. h> 


# include <(stdlib. h > 
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# include <unistd.h> 

d include «string. hi 
dinclude  «2sys/types. h 
Ë include «2 sys/ socket. hi» 


di include <“netinet/in. hi> 
zt define oops(m,x) { perror(m) ;exit(x):} 


int make dgram server socket(int), 
int get internet address(char' „int, int’ struct sockaddr in"); 
void say who calied(struct sockaddr in x 5; 


void reply to sender(int,char # „struct sockaddr in * , socklen t); 


int main(int ac, char « avli) 


{ 


int port; /* use this port «/ 

int Sock; /* for this socket x/ 

char buf[ BUFSIZ |; /* to receive data here x/ 

size t megler; /* store its length here «/ 
struct sockaddr in saddr; /* put sender’s address here «/ 
Socklen t saddrlen; /* and its length here «/ 

if (ac == 1 || (port = atoi(av[1) <= 034 


fprintf(stderr, “usage; dgrecv portnumber\n") ; 


exit(1); 


/* get a socket and assign it a port number x/ 


if( (sock = make dgram server socket(port)) == -1) 


oops( "cannot make socket",25; 
/* receive messaages on that socket «/ 


saddrlen = sizeof(saddr); 

while (msglen = recvfrom(sock,buf,BUFSIZ,0, &saddr,&saddrlen)):»0 ) i 
bufímsglen] = 'A0'; 
printf("dgrecv, got a message; * sin", buf); 
say who called(&saddr); 
reply to sender(sock,but,&sarr, saddrlen) - 

i 

return 0; 

void reply to sender(int sock,char » msg, struct sockaddr in * addrp,socklen t len) 


{ 
char reply| BUFSIZ + BUFSIZ]; 


sprintf(reply, "Thanks for your *d char message\n", strlen(msq)): 
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sendto(sock, reply, strlen(reply), 0, addrp, len); 
} 
void say who called(struct sockaddr in x addrp) 
i 
char host[ BUFSIZ ]; 
int port; 
get internet address(host,BUFS1Z,&port,addrp); 
printf(" from, $s; &d\n", host, port); 


发 送 者 程序 当然 也 要 改变 以 接收 应 答 。 这 作为 练习 由 读者 来 完成 。 
13.5.5 数据 报 小 结 


数据 报 是 从 一 个 socket 发 送 到 另 一 个 的 得 消息 。 发 送 者 使 用 sendto 来 指定 消息 ,长度 
和 目的 地 。 接 收 者 使 用 recvirom 接收 消息 。 数 据 报 和 带 有 地 址 的 Internet 上 传输 的 数据 包 
的 基本 结构 接近 。 因 此 ,数据 报 给 内 核 网 络 功 能 和 网 络 流量 增加 的 负荷 较 少 。 由 于 数据 报 
可 能 在 传输 中 丢失 ,也 有 可 能 不 按 师 序 地 到 达 , 所 以 它 道 常用 对 简单 和 高 效 的 要 求 比 完整 性 
和 一 致 性 更 为 重要 的 应 用 中 。 

本 章 的 许可 证 服务 器 是 一 一 种 简单 的 消息 传输 , 它 用 一 一 个 服务 器 来 接收 .处 理 短 消 息 和 发 
送 请 求 ,所 以 数据 报 是 一 个 合适 的 选择 。 


13.6 许可 证 服务 器 版 本 1.0 


下 面 , 回 到 许可 证 服务 器 项 目 上 来 。 这 里 的 服务 器 限制 了 程序 同时 运行 的 实例 数 日 。 
当 用 户 要 运行 受 限 制 的 程序 时 ,该 进程 要 向 服务 器 请 求 运行 许可 。 

如 果 并 没有 很 多 人 正在 用 该 程序 ,服务 器 发 送 桶 据 给 进程 ,给 予 许可 证 。 如 果 法 到 了 最 
大 的 程序 实例 数 ,服务 器 发 送 无 可 用 票据 的 消息 给 客户 ,并 旦 通知 客户 稍 后 再 试 或 者 购买 支 
持 更 多 用 户 版 本 的 软件 。 被 许可 程序 和 服务 器 之 问 通过 数据 报 来 通信 ， 

客户 和 服务 器 的 运行 流程 及 其 交互 过 程 记 下 。 





clnt sry 








Bet tick 
do your 


wait for RO 
recv RO 
proc RO 
reply to RC 












work 
tel tick 
exit 






客户 和 服务 器 分 别 由 两 个 文件 组 成 : CPE main 两 数 ,长 的 文件 包含 票据 管理 
函数 。 下面 将 分 析 窜 户 和 服务 器 程序 。 
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13.6.1 客户 端 版 本 1 


JN ee ee ee ee E CERE OEC XXE EE XE 
* lcintl.c 

* License server client version 1 

* link with lclnt funcsl.o dgram.o 

xf 


# include < stdio, ho 


int main(int ac, char * av[ |} 
{ 
setup(); 
if (get ticket() [= 0) 
exitio; 


do regular work(); 


release ticket(); 


shut down(); 


) 


PRM EAR NAR HO ERA R EROGO E REOR OUR EK X XE KE 
* do regular work the main work of the application goes here 
x/ 
do regular work() 
{ 
printf("SuperSleep version 1.0 Running - Licensed Software\n") : 


sleep(10); /* our patented sleep algorithm «/ 


客户 端的 最 上 层 代码 遵照 了 上 一 节 中 所 小 结 的 原则 。 客 户 得 到 票据 ,进行 处 理 , 释 放 票 
据 , 然 后 退出 。 该 许可 证 例 程 是 Unix 中 sleep 程序 的 特殊 版 本 , 若 不 满意 标准 sleep 版 本 的 
工作 ,也 可 以 购买 许可 证 来 使 用 此 版 本 的 程序 。 当 然 还 要 运行 许可 证 服务 器 ,否则 该 sleep 
程序 将 拒绝 运行 。 其 中 辅助 函数 在 lclnt_funcsl.c rf; 


JEXAXHYNXGEXNERENRTERKEKKXXEXXXEAXXXKEKNSENXENRREXTAXENAXKEXXEXEXXXXEREEXX 
* lcint funcsi.c, functions for tbe client of the license server 


xf 


# include <(stdio. ho 

i include <I sys/types. h> 
# include «< sys/ socket., h> 
# include < netinet,/ in. h> 
# include < netdb. ho> 
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fs 


* Important variables used throughout 


*/ 
static int pid = -1; /* Our PID «/ 
static int sd s - 1; /* Gur communications socket #/ 
static struct sockaddr serv acddr; /* Server address «/ 
static socklen t serv alen; /* length of address x/ 
static char ticket buf[128]; /* Buffer to hold our ticket »/ 
static have ticket = 0; /* Set when we have a ticket x/ 
# define MEGLEN 128 /* Size of our datagrams «/ 

# define SERVER PORTNUM 2020 /* Our server’s port number */ 
# define HOSTLEN 512 


3t define oops(p) į perror(p) ; exit(1) ; } 
char x do transaction(); 


/* 

* setup; get pid, socket, and address of license server 

* IN no args 

* RET nothing, dies on error 

* notes, assumes server is on same host as client 

xf 
setupi) 

{ 

char hostname[LBUFSTZ ; 


pid = getpid(); /* for ticks and msgs x, 
sd = make dgram client socket(); /* to talk to server x/ 
if (sd == -1) 

oops( "Cannot create socket") - 
gethostname(hostname, HOSTI.FN} ; /* server on same host «/ 


make internet address(hostname, SERVER PORTNUM, &serv addr); 


serv alen = sizeof(serv_addr); 


shut down() 
{ 
close( sd}; 
}》 
ee ee ee EN ORE EX EXE XEOGEGCEEEXRX XSAEXXEXXXXSEUrEXXEX 
* get ticket 
* get a ticket from the license server 
* Results; 0 for success, -1 for failure 
xf 


int get ticket() 
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char * response; 
char buf|MSGLEN :; 


if(have ticket) /* don't be greedy x/ 
return); 

sprintf(buf, "HELO *d", pid); /* compose request */ 

if ( (response = do transaction(buf)) == NULL) 


return( — 1); 


/* parse the response and see if we got a ticket. 
* on success, the message is: TICK ticket 一 string 
* on failure, the message is; FAIL failure - msg 
*/ 
if ( strnemp(response, "TICK", 4) == 094 
strepy(ticket buf, response + 5); /* grab Licket - id «/ 
have ticket - 1; /* set this flag «/ 
. narrate( "got ticket", ticket buf); 


return(0); 


if ( strnemp(responsc, FAIL",4) == 0) 
narrate( "Could not get ticket",response); 
else 


narrate( "Unknown message: ", response); 


F 


return( — 1); 


| f/x get ticket »/ 


JXKOEGROR RECEN RMR KERR X X OR COCA EXE XGA X 6X OX X X GRO JC XO X 3€ X XOX OH KO X X X X X X ox E 


* release ticket 
* Give a ticket back ro the server 


* Results, 0 for success, ~ 1 for failure 


int release _ticket(} 


{ 


char buf| MSGLEN!; 


char * response; 


if(! have ticket? /* don't have a ticket */ 
return(0); /* nothing to release «/ 

sprinti(bef, "CBYE * s", ticket buf); /* compose message x, 

if ( (response = do transaction(buf)) == NULL } 


return( - 1); 


/* examine response 
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* success; THNX info string 


* failure, FAIL error - string 


] 


H; 

if ( strncmpíresponse, "THNX", 4) == 0) 
narrate( "released ticket OK" ""»: 
return 0; 

I 

if ( strncmpíresponse, "FAIL", 4) == 0) 
narrate( "release failed", response + 5); 

else 


narrate( "Unknown message:", response); 
rcturn( - 1); 


} /* release ticket */ 


{RE RRR HER WX OX X x X 0 X* o3 X WX X X03 X X GOX X KKK KKREHR RHE YX* Xo * X x Xo X X ox X X xXxx-xxXe 
* do transaction 
* Send a request to the server and get a response back 
x IN msg n message to send 
« Results, pointer to message string, or NULL for error 
* NOTE, pointer returned is to static storage 
* overwritten by each successive call. 
* note, for extra security, compare retaddr to serv addr (why?) 
xf 
char * do _transaction(char * msg) 
i 
static char buf[MSGLEN]; 
struct sockaddr retaddr; 
socklen t addrlen- sizeot(retaddr); 


int ret; 


ret = sendto(sd, msg, strlen(msg), 0, &serv addr, serv alen); 
if (ret -- -1)[( 
syserr( "sendto") > 
return( NULL) ; 
} 
/* Get the response back +/ 
ret = recvfrom(sd, buf, MSGLEN, 0, &retaddr, Saddrlen}; 
if ( ret == -1)4 
syserr("recvfrom"); 


returni NULL); 


/* Now return the message itself «/ 


returnibuf); 
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i /x do transaction «/ 


FERRER RHE RHEE RY ER ERM RADA RHE RAR HRA HK ECKE RE X REX XE X XXX XX Exe x 
* narrate: print messages to stderr for debugging and demo purposes 
* IN msgl, msg2 ; strings to print along with pid and title 
* RET nothing, dies on error 
x/ 

narrate(char * msgl, char * msq2) 

{ 

fprintf(stderr, "CLIENT | $d]; %s £&sVn", pid, msgl, msg2); 

t 

syserr(char * msgl) 

( 

char buf[ MSGLEN] ; 
sprintf(buf, "CLIENT [ &d]: %s", pid, msgl); 
perror(huf): 

} 


get ticket 和 release ticket 是 程序 中 的 主要 函数 ， 它 们 都 遵循 下 面 的 规则 : 产生 短 请 
求 .发送 消 息 给 服务 器 .等待 服务 器 的 应 答 ,然后 检查 应 答 和 根据 应 符 采 取 行 动 。 

get ticket 通过 发 送 命 令 HELLO 以 及 紧 跟 其 后 的 PID 来 请 求 票据 。 服 务 器 通过 发 送 
TICK ticket-id 接收 请 求 。 服 务 器 发 送 FAIL explanation FEA eK 

release — ticket 通过 发 送 命 令 GBYE ticker - id 返回 票据 。 如 果 票 据 基 合法 的 ,服务 器 将 
发 送 THNX greeting 消息 作为 应 管 。 如 果 票 据 不 台 法 ,服务 器 发 送 FAIL explanation WE. 

AWARE THERA? 本 文 的 后 面 将 讨论 该 问题 。 


13.6.2 服务 器 端 版 本 1 


JRA R RHEE RMN HE MAHER XRXCROUX AX XN XE X X OX X X X G3 0X X £KOX X X X X o Xo X X XX XX 
* lservl.c 
* License server server program version 1 


关 


# include e stdio, h> 

# include <sys/types.h> 
# include  «sys/socket. h> 
H include <“netinet in. h> 
# include -signal.ho— 

# include  -Zsys/errno.h7- 


# define MSGLEN 128 /* Size of our datagrams x/ 


int main€int ac, char x» awl ]) 
{ 
struct sockaddr_in client_addr; 


socklen t addrlen = sizeof(client addr); 
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char buf[MSGLEN: + 
int ret; 

int Sock; 

sock = setup(); 
while(1) | 


addrlen = sizeof(client addr); 
ret = recvfrom(sock, buf ,MSGLEN,0,&client_addr,&addrlen) ; 
if(ret!- -1{ 
bufi ret] = 'A0'; 
narrate( "GOT.", buf, &client addr); 
handle request(buf,&client addr,addrlen); 
; 
eise if ( errno ! = EINTR } 


perror( "recvrrom'); 


jr RD UF BE 38 80 E RE AED ER Bu $E BE PP AOR LABORO AGE RUE. HK 
中 处 理 请 求 的 代码 包 信 在 Iserv, funcsl. c 文件 中 。 


JOROM ee XXE EUN EAE AE ECCE ee ee ee ee es 


* lsrv_funest.c 
* functions for the license server 


x È 


# include «istdio. h> 

# include <(sys/types. h> 
# include -< sys/ socket. hi> 
# include «2 netinet/ in, h> 
# include  «netdb. h> 

# include «c signal.h— 


Hinclude  «sys/errno.h7- 


# define SERVER PORTNUM 2020 /* Our server's port number x/ 
i; define MSGLEN 138 /* Size of our datagrams #/ 

H define TICKET AVAIL 0 /* Slot is available for use »/ 
# define MAXUSERS 3 /* Only 3 users for us x/ 


F define cops(x) { perror(x); exit( — 12; | 


JUGE OA EOX REOR MOX X OXON EGRE EU ICA X XoxOKX X OX Xo XOX X X Xo X X X X X Wo X X X 4 Xx X X XX OX OX 


* Important variables 


] 


x/ 
int ticket array| MAXUSERS]; /* Dur ticket array «/ 
int sd = -1; fs Our socket x/ 


int num tickets out = 0; /* Number of tickets outstanding x/ 


r 
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char * do hello(); 
char * do _goodbye(); 


JOOKCKOKOX X ER X N WX GO X X A X OX X KE X X NRK X RON OX MOX HH RON OE Mox X M WO OX OM X XoXOX X £OXOWOX X 0X *oX* X X ox 
* setup() - initialize license server 

ef 

setup() 


J 
1 


sd = make dgram server socket(SERVER PORTNUM); 
if (ad == -1)J 
oops( "make socket"); 
free all tickets(); 
return sd; 
} 
free all tickets() 
i 


int i; 


, 


for(i-0; i</MAXUSERS; i++) 
ticket _array|i] = TICKET_AVAIL; 


PRERE REEMA PERAK R AAT RASHES MEN EHR RR HR RH RR TRE ER Et 
x shut down() 一 close down license server 
xf 
shut_down() 
close( sd}; 


! 


(RRM ES KARA RE ER AREER EEK EM KAMER RE RRR REE ER EMER NRE 
x handle request(request, clientaddr, addrlen? 
* branch on code in request 
*/ 
handle request(char x req,struct sockaddr in + client, socklen t addlen) 
{ 
char * response; 


int rat; 


/* act and compose a response */ 

if ( strnemp(req, "HELO", 4) == 0) 
response = do hellotreq?; 

else if ( strncmp(req, "GBYE", 4) == 0) 
response = do goodbye(req); 

else 


response = “FAIL invalid request"; 
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/* gend the response to the client «/ 
narrate( "SAID,", response, client); 
ret = sendto(sd, response, strlen(response),0,client, addlen); 
if ( ret == -1) 
perror( "SERVER sendto failed"); 


fee *XOox X X Xo SRE NER X X X 4 * X X Xo X Xo x Ox X* x HE GXOX* OX X OX X X X X X X FOX o£ X X XX X X X € X X KR RHR EH 
* do hello 

* Give out a ticket if any are available 

* IN msg p message received from client 

* Results; ptr to response 

* Note, returnis in static buffer verwritten by each call 


* NOTE, return is in static buffer overwritten by each call 
* i 

char *do hello(char * msg p) 

i 


int x; 


static char replybuf|MSGLEN|; 


if(num tickets out “> = MAXUSERS) 
return "FAIL no tickets available") : 


/* else find a free ticket and give it to client #/ 
for(x = 0; x«:MAXUSERS && ticket array[x] | = TICKET AVAIL; x++) ; 


/* A sanity check 一 should never happen »/ 
if(x == MAXUSERS) 1 
narrate( "database corrupt","" NULL); 
return( "FAIL database corrupt"); 


/* Found a free ticket. Record "name" of user ( pid) in array. 
* generate ticket of form: pid. slot 
P 
ticket array[x] = atoi(msg p | 53; f* get pid in mag x/ 
Sprintf(replybuf, "TICK % d, $d", ticket array[x|, x); 
num tickets out++ ; 


return(replybuf), 
| /* do helio s/ 


PRR RR RR HHH HEN ER HE EK RK EEN HENLE REMARK MERE 
* do goodbye 

* Take back ticket client is returning 

* IN msg p message received from client 


* Results; ptr to response 
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* Note; return is in static buffer over written by each call 
a? 
char * do geodbye(char * msg p? 


i 
int pid, slot; /* components of ticket =/ 


/* The user's giving us back a ticket. First we need to get 
* the ticket out of the message, which looks like, 
* 
* GBYE pid. slot 
*ÜÓ 
if((sscanf((msg p + 5), "*d. €&d", &pid, &slot} |= 2) |l 
(ticket array[ slot] |= pid)? : 
narrate("Boqus ticket", msg p-* 5, NULL); 
return( "FAIL invalid ticket"); 


H 
i 


/* The ticket is valid. Release it. x/ 
ticket array|siot] = TICKET AVAIL; 


num tickets out -- ; 


/* Return response x/ 
return( "THNX See yal); 
} /* do goodbye »/ 


JG XX ORO EORR XO REE R ER RR RRR MK REE EERE KERR ERE E AEM XXX REL REE MEE 


x narrate() — chatty news for debugging and logging purposes 


r 


xf 
narrate(char * msgl, char x msq2, struct sockaddr in * clientp) 


{ 
fprintf(stderr, "\t\tSERVER, *s $s", msgl, msg2); 
if ( clientp ) 


fprintf(stderr, "{ t s; $d)",inet ntoa(clientp- ~»sin_addr), 
ntohs(clientp- 75in port) ); 
putc('Àn' 


, stderr}; 


3 个 重要 的 函数 解释 邵 下。 

(1} handle request 

请 求 由 4 个 字符 的 命令 带 -- 个 参数 构成 。 服 务 器 先 检查 命令 RADAR. BI 
使 命令 丰台 法 ,服务 器 也 必须 发 适应 答 ,否则 客户 会 一 直 阻 塞 下 去 。 

(23 do, hello 

HELO fp FASE TPR mH. ARS SRA Fe ER SPARGSIMÓUI. ROR) PID 值 为 
0: 表 示 这 是 一 个 可 用 票据 。 服 务 器 使 用 独立 的 变量 num, tickets out 米 节 省 时 间 。 服 务 器 
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接收 请 求 后 ,可 以 通过 查找 表 米 寻找 空闲 项 ,而 该 变量 可 以 指明 何 时 表 已 经 满 了 ,这 样 就 不 
AES AL BE ART 

(3) do_goodbye 

GBYE ds BRE SMR. RHA D ph PID 和 票据 编号 构成 的 字符 串 。 服 务 器 
将 票据 的 PID 和 票据 编号 与 签 出 列表 (sign- out list) 中 的 值 进行 比较 ,如 果 数 据 一 臻 ,服务 
器 从 签 出 列表 中 清除 该 项 的 值 并 日 致谢 客 户 。 如 果 不 一 致 , 则 一 定 是 什么 屯 方 发 咎 了 错误 。 

如 果 你 是 飞机 上 场 的 检票 员 , 如 果 某 个 客户 给 出 存根 的 编号 和 名 字 在 数据 库 中 不 存在 ,你 
就 可 能 会 问 :“ 你 是 从 哪里 得 到 这 张 票 的 ,你 是 谁 ”后 曾 将 讨论 伪造 票据 问题 。 下 而 来 测试 
这 个 版 本 的 程序 。 


13.6.3 测试 版 本 1 
编译 服务 器 端 程序 并 在 后 台 运 行 它 ， 











$ cc lservl.c lserv funcsl.c dgram.c - o iservl 
å .f/lservi& 
[1] 25738 


编 详 好 客户 端 程序 ,然后 同时 运行 4 个 实例 ; 


$ ec lelntl.c lelnt funcsi.c dgram.c - o lclnti 
$ ./lclntl&./lclnti&£,/lclntl&./lclnt! & 


SERVER; GOT; HELO 25912(10.200.75.200,1053) 
SERVER: SAID, TICK 25912. 0(10. 200. 75. 200, 1053) 

CLIENT[25912]:got ticket 25912.0 

SuperSleep version 1.0 Running Licensed Software 
SERVER; GOT,HELO 25913(10. 200. 75. 200.1054) 
SERVER; SAID, TICK 25913.1(10.200. 75. 200,1054) 

CLIENT[L25913] ,got ticket 25913. 1 

SuperSleep version 1.0 Running - Licensed Software 
SERVER, GÖT: HELO 25915(10. 200.75. 200,1055) 
SERVER; SAID, TICK 25915.2(10.200.75. 200.1055) 

CLIENT 25915 ] :get ticket 25915, 2 

SuperSleep version 1.0 Running - Licensed Software 
SERVER; GOT; HELO 25914(10.200. 75. 200,10595 
SERVER: SAID; FAIL no tickets available (10.200.75.200,1059) 

CLIENT: 25914 :Could not get ticket FAIL no tickets available (10. 200.75. 200 21059) 
SERVER: GOT, GBYE 25912.0(10. 200. 75. 200,1053) 
SERVER, SAID, THNX See ya! (10.200. 75. 200.1053) 

CLIENT[ 25912]-released ticket OK 
SERVER; GOT;GBYE 25313, 1(10. 200. 75. 200,1054) 
SERVER, SAID, THNX See ya! (10.200.75.200,1054) 

CLIENT[ 25913] : released ticket OK 


第 13 章 ”基于 数据 报 (Datagram) 的 编程 : 编写 许可 证 服务 器 2 * 407 * 





SERVER; GOT.GBYE 25915.2(10.200.75.200;1055) 
SERVER; SAID; THNX See ya! (10. 200.75. 200;1055) 
CLIENT[ 25915 |; released ticket OK 


实际 运行 的 程序 可 能 有 非常 不 同 的 结果 。 尽 管 如 此 ,从 中 可 以 看 到 服务 器 如 何 接收 请 
AR .给 出 票据 以 及 客户 端 如 何 获取 票据 并 开始 工作 的 : 可 以 看 到 进程 25914 没有 得 到 票据 。 
因为 在 该 进程 出 现时 ,所 有 的 票据 都 已 经 被 占用 了 ,而 之 前 进程 25915 却 得 到 了 一 张 票据 。 
如 果 运 行 该 程序 多 次 ,可 能 会 看 到 不 同 的 结果 。 


13.6.4 进一步 的 工作 


版 本 1 的 许可 证 服务 器 可 以 很 好 地 工作 了 : 服务 器 处 理 请 求 并 且 维持 持 有 票据 的 进程 
列表 。 客 户 可 以 从 服务 器 得 到 票据 。 现 在 为 止 一 切 都 正常 。 看 起 来 这 非常 理想 。 不 过 现实 
世界 并 不 总 这 样 美 好 ,软件 及 其 使 用 者 并 不 完全 是 你 所 期 望 的 那样 。 可 能 出 现 什么 错误 呢 ? 
该 如 何 处 理 这 些 错误 呢 ? 


13.7 ”处理 现实 的 问题 


这 里 的 许可 证 服务 器 能 很 好 地 工作 ,前 提 是 所 有 的 进程 是 正常 工作 的 。 有 时 ,软件 可 能 
运行 出 错 。 如 果 SuperSleep 程序 被 另外 一 个 用 户 杀 死 了 ,或 者 程序 发 生 段 存 取 错 误 而 被 内 
核 杀 死 了 ,该 如 何 呢 ? 对 于 它 所 占用 的 票据 该 如 何 处 理 呢 ? 如 果 服 务 器 崩溃 了 怎么 呢 ? 在 
服务 器 重启 后 又 将 发 生 什 么 呢 ? 

现实 世界 中 的 程序 必须 能 够 处 理 异 常 衣 溃 。 这 里 考虑 两 种 情形 : 客户 端 户 溃 和 服务 器 
Wim. 


13.7.1 处 理 客户 端 骨 溃 
如 果 客 户 端 崩溃 ,客户 将 不 会 归还 票据 ,如 图 13. 8 所 示 。 


签 出 列表 中 死 进 
程 对 应 的 条 目 


如 果 该 进程 月 溃 ， 
将 不 会 返回 票据 





图 13.8 客户 不 归还 票据 


在 出 租车 公司 里 ,雇员 可 能 辞职 ,被 解聘 、 回 家 或 死亡 ,但 仍 持 有 公司 轿车 的 钥匙 。 这 些 
对 公司 将 造成 什么 影响 呢 ? 签 出 列表 指明 票据 仍 被 占用 。 其 他 进程 就 不 能 得 到 该 票据 。 但 
是 ,如 果 有 足够 多 的 进程 崩溃 , 签 出 列表 就 可 能 虽然 满 了 ,但 此 时 却 没有 运行 的 客户 程序 。 

钥匙 管理 员 通 过 给 持 有 钥匙 的 人 打 电 话 , 就 可 以 收回 钥匙 。 他 可 以 定期 地 浏览 签 出 列 
表 , 然 后 给 每 个 司机 打 电 话 ，“ 你 仍 在 使 用 车 吗 ?”。 如 果 无 人 响应 ,管理 员 把 他 的 名 字 从 签 出 
列表 中 划 去 ,管理 员 检查 的 频率 越 高 , 签 出 列表 的 精确 性 就 越 高 。 
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许可 证 服务 器 可 以 使 用 相同 的 技术 ,定期 检查 票据 数组 ,确认 其 中 的 每 个 进程 是 否 还 活 
着 ? 如 果 某 个 进程 已 经 不 存在 了 ,服务 器 可 以 把 该 进程 从 数组 中 去 除 ,释放 其 占用 的 票据 。 
检查 程序 运行 的 越 频 繁 ,数组 的 精确 性 越 高 。 

l. 收回 丢失 的 票据 : 调度 

服务 器 中 如 何 增加 收回 票据 的 代码 ?如 何 调用 这 些 代 码 ? 服务 器 必须 实现 两 个 独立 的 
操作 : 等 待 客户 的 请 求 , 同 时 周期 性 地 收回 丢失 的 票据 。 而 调度 行为 是 简单 的 : 只 要 使 用 
alarm 和 signal 技术 来 周期 地 调用 一 个 函数 。 在 前 面 章 节 的 移动 文字 例子 中 ,使 用 了 这 种 技 
术 。 修 订 的 程序 流程 如 人 图 13. 9 Bron 








”图 13.9 “使 用 alarm 来 调度 票据 消除 程序 


在 设计 需 同 时 处 理 两 件 事情 的 程序 时 ,必定 要 考虑 函数 之 间 的 冲突 。 如 果 服 务 器 正在 
处 理 客户 请 求 的 同时 ,被 SIGALAM 信号 触发 调用 回收 丢失 的 票据 的 函数 ,会 产生 问题 吗 ? 
这 两 个 处 理 函 数 共享 变量 或 者 数据 结构 吗 ? 显然 是 的 ,发 放 票 据 需 要 修改 签 出 列表 ,而 收回 
票据 也 需要 修改 签 出 列表 。 这 种 冲突 可 能 会 破坏 数据 的 一 致 性 吗 ? 该 问题 留 作 课 后 练习 。 
考虑 到 安全 性 ,在 处 理 请 求 的 时 候 关 闭 alarm, 

2. 收回 丢失 的 票据 : 编程 

服务 器 希望 能 回收 已 经 不 存在 进程 的 票据 。 那 么 如 何 判 断 进程 是 否 还 活着 呢 ? 可 以 使 
用 popen 来 运行 ps, 然 后 从 ps 的 输出 中 查找 PID, 以 确定 持 有 票据 的 PID 是 否 存 在 。 另 一 
种 快速 简洁 的 方法 是 使 用 kill 系统 调用 的 特殊 功能 。 

可 以 通过 给 进程 发 送 编 号 为 0 的 信号 以 确定 它 是 否 存 在 。 如 果 进 程 不 存在 ,内 核 将 不 会 
发 送信 号 ,而 是 返回 错误 并 设置 errno 为 ESRCH。 在 ticket_reclaim 中 使 用 了 该 特征 ,该 函 
数 在 lserv_funcs2. c 文件 中 : 


# define RECLAIM INTERVAL 60 / # reclaim every 60 seconds x/ 

[He HH FEE HE EE EE EEE EEE JE IE DE ME EEE MEJE ESE SEE EHO HO KE 
* ticket_reclaim 

* go through all tickets and reclaim ones belonging to dead processes 


* Results; none 
*/ 
void ticket_reclaim() 


{ 
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int i; 
char tick[BUFSIZ]; 
for(i = 0; i < MAXUSERS; i++) | 
if((ticket_arrayli] ! TICKET AVAIL) && 
(kill(ticket array[i;, 0) == - 1) && (errno == ESRCH)) | 
/* Process is gone - free up slot x/ 
sprintf(tick, "sd. $d", ticket array[il,i); 
narrate("freeing", tick, NULL); 
ticket array[i? = TICKET AVAIL; 


num tickets out-- ; 


} 
alarm(RECLAIM INTERVAL); /* reset alarm clock x/ 


} 


接 下 来 ,在 main om Re pi el RE Fe fc S8 485 HEE REE alarm。 修 改过 
的 main 在 文件 Iserv2. c 4, 


int main(int ac, char x av[ ]) 
{ 
struct sockaddr client_addr; 
socklen_t addrlen- sizeof(client_addr) ; 
char buf| MSGLEN | ; 
int ret, sock; 
void ticket reclaimt); /* version 2 addition #/ 


unsigned time left; 


sock = setup; 


signal (SIGALRM, ticket reclain); /* run ticket reclaimer x/ 
alarm{ RECLAIM INTERVAL), /* after this delay «/ 
while(1) | 


addrlen = sizeof(client addr); 

ret = recyfrom(sock,huf,MSGLEN,O,&client addr,&addrlen); 
if (ret l= -1}f 

buf]ret] = 'X0'; 

narrate("GOT,", buf, &client addr), 

time left = alarm(Q); 

handle request(buf,&client addr,addrien); 
alarm(time left); 

} 
else if ( errno | = EINTR ) 

perrorí "recvfromn"); 


} 
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通过 上 面 的 修改 ,许可 证 服务 器 就 可 以 周期 性 地 检查 票据 了 。 确 实 需 要 这 样 周期 性 地 
检查 吗 ? 为 什么 不 只 在 票据 列表 满 了 并 且 有 客户 的 请 求 被 拒绝 的 时 候 检查 呢 ? 这 样 会 更 
好 吗 ? 


13.7.2 处 理 服务 器 骨 溃 


服务 器 月 溃 通 常 有 两 个 严重 的 后 果 。 首 先 , 签 出 列表 丢失 ,失去 进程 持 有 票据 的 记录 。 
其 次 ,新 客户 不 可 以 再 运行 ,因为 分 发 许可 证 的 程序 已 经 不 存在 。 最 简单 的 解决 方法 是 重新 
启动 服务 器 ,如 图 13. 10 所 示 。 


先前 服务 器 








新 客户 可 
以 得 到 一 





图 13.10 ”服务 器 在 崩溃 后 重启 


重启 服务 器 使 得 新 的 客户 可 以 运行 ,但 会 带 来 两 个 新 的 问题 。 

首先 ,重启 服务 器 的 票据 数组 是 空 的 ; 服务 器 含有 新 的 未 被 取 走 的 票据 列表 。 崩 省 的 服 
务 器 的 票据 数组 可 能 已 经 满 了 ,而 重启 服务 器 仍 给 其 他 客户 发 送 许可 。 这 样 重复 地 关闭 服 
务 器 ,再 重启 服务 器 就 像 印 钞 机 一 样 可 以 产生 更 多 的 票据 。 

其 次 , 持 有 旧 的 服务 器 的 票据 的 客户 在 归还 票据 时 ,将 会 被 认为 是 伪造 票据 。 

1. 票据 验证 

上 述 问 题 的 一 个 解决 方法 是 票据 验证 。 票据 验 证 表示 每 个 客户 周期 性 地 向 服务 器 发 送 
票据 的 副本 。 客 户 发 送 数 据 包 , 对 服务 器 说 :“ 这 是 我 的 票据 。 是 合法 的 吗 ??, 如 图 13. 11 
Bram. 





13.11 客户 验证 票据 


票据 含有 数组 编号 和 PID。 服 务 器 检查 签 出 列表 。 如 果 该 项 为 空 ,服务 器 可 以 认为 该 
票据 是 自己 先前 的 实例 赋予 的 。 服 务 器 将 会 把 该 票据 加 到 列表 中 。 逐 步 地 ,客户 提供 票据 
来 验证 , 签 出 列表 被 重新 填 人 。 

服务 器 重建 签 出 列表 解决 了 表 丢 失 问 题 , 但 可 能 导致 其 他 问题 。 如 果 一 个 新 的 客户 在 
表 重 建 好 之 前 ,请 求 票据 ,服务 器 可 能 分 发 一 个 已 经 给 予 其 他 客户 的 票据 给 该 客户 。 当 持 有 
旧 的 票据 的 客户 对 其 票据 进行 验证 时 ,服务 器 会 拒绝 它 。 








第 13 章 ”基于 数据 报 (Datagram) 的 编程 : 编写 许可 证 服务 器 ? * 411 « 


另 一 种 方法 是 服务 器 拒绝 表 中 没有 的 所 有 的 票据 。 持 有 被 拒 票据 的 客户 尝试 再 申请 新 
的 。 这 种 方法 是 否 更 好 ? 

2. 协议 中 增加 验证 

票据 验证 是 协议 中 的 一 个 新 的 事务 : 


CLIENT; VALD tickid 
SERVER; GOOD or FAIL invalid ticket 


这 里 必须 改变 客户 和 服务 器 以 支持 验证 。 
3. 客户 端 增加 验证 
客户 端 增加 验证 ,需要 编写 一 个 函数 并 在 主 函 数 中 调用 它 ,其 流程 如 图 13. 12 所 示 。 


clnt 
srv 


HELO pid  ——— 
< TICK tickid 


GBYE tickid— 
— THNX 


VALD tickid——p | PERR 














图 13.12) 客户 定期 验证 票据 


客户 可 以 根据 系统 的 需要 以 一 定 的 间隔 定期 验证 票据 ,可 以 设置 一 个 计时 器 来 定期 验 
证 。 如 果 客 户 是 一 个 电子 制 表 程序 ,验证 可 以 在 一 定量 的 计算 结束 后 进行 。 一 个 许可 证 服 
务 器 会 响应 验证 请 求 。 

SuperSleep 客户 程序 可 以 把 10 秒 的 睡眠 时 间 分 割 成 两 个 5 秒 ,在 这 期 间 进 行 验证 。 这 
作为 课 后 练习 。 

4. 服务 器 端 增 加 票据 验证 

服务 器 端 增加 验证 需要 做 两 处 改动 。 改 动 后 的 程序 位 于 新 的 文件 lserv_funcs2. c tH, 
首先 ,增加 一 个 函数 来 验证 票据 : 


[CROCI CC OR GIC ME EJE JEDE JEE ME IE AE ME IE OCC EXE GIG HE EE HE EEE EE OEE 
* do validate 
* Validate client's ticket 
* IN msg p message received from client 
* Results, ptr to response 
* NOTE; return is in static buffer overwritten by each call. 
x/ 
static char * do validate(char * msg) 
{ 
int pid, slot; /* components of ticket */ 


/* msg looks like VALD pid. slot — parse it and validate x/ 
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if (sscanf(msg + 5," & d. &d",&pid,&slot) == 2 && ticket array[slot] == pid) 
return( "GOOD Valid ticket") + 


/* bad ticket «/ 
narrate( "Bogus ticket", msq * 5, NULL); 
returni "FAIL invalid ticket"); 


HK handle request 中 增加 更 多 的 判断 ， 


handle request(char x req, stmet sockaddr in * client, secklen_t addlen) 
i 


char x response; 


int ret; 


/* act and compose a response x/ 


if ( strnoemp(req, "HELO", 4) == 0) 
response = do hello(req); 

else if ( strncmp(req, "GBYE", 4) == 0) 
response = do_goodbye( req) ; 

else if ( strncmp(reg, "VALD", 4) == 0} 
response = do validate(req); 

else 
response = "FAIL invalid request"; 


/* send the response to the client x/ 
narrate( "SAID;", response, client); 
ret = sendto(sd, response, strlen(response),0, client, addlen); 
if (ret == -1) 
perror( "SERVER sendto failed"); 


13.7.3 测试 版 本 2 


现在 可 以 编译 和 测试 新 版 本 的 客户 和 服务 器 了 。 测 试 包含 了 杀 死 客户 和 服务 器 以 及 重 
启 客户 和 服务 器 。 试 观察 输出 中 的 进程 ID 和 消息 。 为 了 便于 测试 ,客户 睡眠 时 间 为 两 个 15 
秘 的 间 甩 ,服务 器 每 5 秒 符 试 回收 票据 。 结 果 如 下 ， 


$ ec lserv2.c lserv funcs2.c dgram.c - o lserv2 
$ cO lclnt2.c lelnt foncs2.c dgram.c - o lelnt2 


$ ./lservo& iml ARS R 
[1]30804 
$ ./lelnt2&./lclnt2£./lclnt2& #6313 qu 
[2130805 


[3130806 
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[4]30807 
5 SERVER. GOT, HELO 30805 (10. 200.75. 200.1085) 
SERVER; SAID; TICK 30805.0 (10.200.75.200,1085) 
CLIENT [30805 |]: got ticket 30805. 0 
SuperSleep vergion 1.0 Running — Licensed Software 
SERVER; GOT; HELO 30806 (10.200. 75. 200,1086) 
SERVER; SAID, TICK 30806. 1 (10. 200.75. 200,1086) 
CLIENT [30806 :got ticket 30806. 1 
SuperSleep version 1.0 Running - Licensed Software 
SERVER, GOT, HELO 30807 (10.200.75.200,1087) 
SERVER; SAID; TICK 30807. 2 (10. 200. 75. 200,108) 
CLIENT [30807 ],got ticket 30807.2 
SuperSleep version 1.0 Running - Licensed Software 
$ kill 30806 kii] 一 个 客户 
[3] - Terminated . /1clnt2 
SERVER; freeing 30806.1 
SERVER; GOT, VALD 30805. 0 (10. 200. 75. 200.1085) 
SERVER; SAID, GOOD Valid ticket (10,200,75.200.1085) 
CLIENT [30805 ],Validated ticket. GOOD Valid ticket 
SERVER; GOT : VALD 30807.2 (10. 200.75.200,1087) 
SERVER, SAID, GOOD Valid ticket (10. 200.75, 200,1087) 
CLIENT [30807], Validated ticket. GOOD Valid ticket 
$ kill30804  dkillHaE 93 


[ 1; Terminated ./lserv2 

$ ./lserv2& 提 启 动 新 的 服务 路 
[5]30808 

$ 


SERVER: GOT; GBYE 306805.0 (10.200. 75. 200, 1085) 

SERVER, Bogus ticket 30B05.0 

SERVER; SAID, FAIL invalid ticket (10. 200.75. 200.1085) 
CLIETN[30805].:release failed invalid ticket 

SERVER;GOT, GBYE 30807.2 (10.200. 75. 200,1087) 

SERVER, Bogus ticket 30807.2 

SERVER, SAID, FAIL invalid ticket (10. 200. 75.200,1087) 
CLIETNÍ 30807] : release failed invalid ticket 
$ ./lelnt2 提 启 动 -个 新 的 客户 

SERVER, GOT. HELO 30805 (10.200.75. 20010857 

SERVER; SAID, TICK 30809. 0 (10. 200. 75. 200.1087) 
CLIENT [30809].got ticket 30809.0 
SuperSleep version 1.0 Running - Licensed Software 

SERVER, GOT . VALD 30809. 0 (10.200. 75. 200.1087) 

SERVER; SAID, GOOD Valid ticket (10.200.75.200,1087) 
CLIENT [ 30809", Validated ticket, GOOD Valid ticket 

SERVER.GOT. GBYE 30809.0 (10. 200. 75. 200.1087} 
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SERVER; SAID; THNX See ya! (10.200.75.200:1087) 
CLIENT [30809]; release ticket OK 
[2] Done . /1clnt2 
[4]- Done . /1clnt2 
$ ps 
PID TTY TIME CMD 
23509 pts/3  00;00;,00 bash 
30808  pts/3 00:00:00 lserv2 
30810 pts/3 00:00:00 ps 
$ 


看 起 来 还 不 错 。 不 妨 试 一 下 上 述 程序 ,观察 其 中 的 交互 过 程 。 


13.8 分 布 式 许可 证 服务 器 


许可 证 服务 器 和 被 许可 程序 通过 socket 进行 通信 ，socket 可 以 连接 不 同 主机 上 的 进程 。 
理论 上 ,与 Web 服务 器 和 客户 运行 在 不 同 主机 上 类 似 , 这 里 的 客户 可 以 运行 在 一 台 机 器 上 ， 
而 服务 器 运行 在 另 一 台 机 器 上 。 当 它们 运行 在 不 同 的 机 器 上 时 ,会 有 问题 吗 ? 是 的 。 
”问题 1: 重复 的 进程 ID 
进程 ID 在 一 台 机 器 上 是 惟一 的 ,但 在 不 同 主机 上 的 进程 可 能 拥有 相同 的 进程 ID。 图 
13. 13 说 明 的 情况 不 含有 任何 错误 上 且 很 常见 。 


许可 证 服务 器 


主机 1 主机 2 





图 13. 13 跨 网 络 PID 不 惟一 


存放 票据 的 表 中 含有 PID 和 票据 编号 。 在 图 13. 13 的 情况 中 ,许可 证 服务 将 认为 给 同 
一 个 进程 分 配 了 3 张 票 。 每 个 进程 只 要 一 张 票 就 可 以 运行 ,所 以 这 是 错误 的 。 请 求 更 多 的 票 
据 ,可 以 被 认为 是 客户 端的 一 个 漏洞 。 

这 里 可 以 扩展 票据 表 项 的 格式 和 内 容 , 使 其 包含 标识 运行 程序 的 主机 从 而 解决 重复 PID 
问题 。 


* 问题 2: 回收 票据 

服务 器 通过 调用 kill(pid,0) 命 令 向 客户 回收 票据 。kill(pid,， 0) 发 送信 号 0 给 持 有 票据 
的 进程 。 通 过 修订 过 的 票据 表 , 服 务 器 现在 可 以 知道 客户 运行 在 哪 台 主机 上 ， 

但 是 ,服务 器 不 能 给 其 他 机 器 上 的 进程 发 送信 号 ,如 图 13. 14 所 示 。 如 果 许可 证 服务 器 
想 给 主机 3 上 的 进程 发 送信 号 ,服务 器 必须 产生 主机 3 上 的 请 求 。 
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图 13.14 进程 不 能 给 其 他 主机 发 送信 号 


为 什么 不 在 每 台 机 器 上 都 运行 一 个 服务 器 的 实例 ”如 图 13. 15 所 示 , 每 个 本 地 的 服务 
器 可 以 监控 丢失 的 票据 。 


许可 证 服务 器 许可 证 服务 器 。 许可 证 服务 器 








图 13. 15 运行 本 地 复制 的 lserv 


本 地 服务 器 解决 了 向 主机 发 送信 号 的 问题 ,但 是 又 带 来 新 的 问题 : 哪个 服务 器 发 布 票 
据 ? 主 服 务 器 如 何 和 本 地 服务 器 通信 ? 客户 把 票据 发 给 谁 验证 ? 

。 问题 3: EOL AM 

如 果 其 中 的 一 台 机 器 停止 运行 ,将 会 发 生 什么 ? 主 服务 器 如 果 还 在 运行 的 话 ,如 何 收回 
票据 ? 客户 端 程序 如 何 验 证 票据 ? 如 果 运 行 主 服务 器 的 主机 停止 运行 , 谁 来 分 发 票据 ? 

如 何 建立 一 个 分 布 式 许可 证 系统 来 同时 支持 多 台 机 器 ? 这 里 有 3 种 方法 。 试 考虑 它们 
的 设计 细节 以 及 优 缺 点 ,并 考虑 当 客户 .服务 器 .计算 机 或 者 网 络 崩 演 时 每 个 方案 的 后 果 。 

。 方 法 1: 客户 端 服务 器 和 中 央 服 务 器 通信 

每 台 机 器 都 有 一 个 本 地 服务 器 ,就 像 本 文 编写 的 那样 。 每 个 客户 跟 本 地 的 服务 器 通信 。 
本 地 服务 器 把 请 求 转 发 给 中 央 服 务 器 。 中 央 服 务 器 返回 票据 或 者 拒绝 。 本 地 服务 器 记录 并 
把 应 答 转发 给 客户 。 本 地 服务 器 也 可 以 强制 执行 一 些 对 本 地 客户 的 限制 ,例如 该 机 器 上 可 
以 运行 的 程序 实例 数 , 或 者 程序 可 以 运行 的 时 刻 。 

”方法 2: 每 个 客户 都 和 中 央 服 务 器 通信 

客户 直接 给 特定 主机 上 的 服务 器 发 送 请 求 。 本 地 服务 器 运行 在 每 个 主机 上 ,但 这 些 服 
务 器 不 和 客户 通信 ,它们 在 重新 声明 票据 的 时 候 作为 中 央 服 务 器 的 代理 。 

”方法 3: 客户 服务 器 和 客户 服务 器 通信 

每 台 机 器 都 有 本 地 服务 器 ,每 个 客户 跟 本 地 服务 器 通信 。 没 有 中 央 服 务 器 。 所 有 的 本 
地 服务 器 间 互 相通 信 。 每 次 一 个 客户 请 求 时 ,本 地 服务 器 询问 其 他 所 有 的 服务 器 目前 已 经 
用 掉 了 多 少 张 票 。 如 果 所 用 票据 数 小 于 所 允许 的 总 数 ,本 地 服务 器 分 配 一 张 票据 给 客户 。 
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13.9 Unix 域 socket 


本 章 的 许可 证 服务 器 中 的 socket 使 用 标准 的 主机 ID 和 端口 号 地 址 系统 。 使 用 这 些 
Internet 地 址 ,服务 器 可 以 接收 本 地 的 万 至 重大 网 络 寺 机 器 的 客户 请 求 。 

在 上 述 的 丙种 分 布 式 洗 可 证 服务 器 模型 中 ,客户 只 需 和 同一 台 主 机 上 的 服务 器 通信 。 
socket 只 能 用 在 仅 限 于 主机 内 部 的 通信 中 吗 ? 


13.9.1 文件 名 作为 socket 地 址 


有 两 种 连接 : 流连 接 和 数据 报 连 接 , 也 有 两 种 socket HAL, Internet 地 址 和 本 地 地 址 。 
Internet WIAA ESL ID 条 端口 号。 本 地 地 址 通常 叫 慌 Unix 域 地 址 , 它 是 一 个 文件 名 { 例 
Bll/dev/log./dev/printer 或 /tmpylserversock) ,没有 主机 和 端口 号 ， 

FA socket 4 /dev/log fil/dev/printer 被 用 在 很 多 Unix RAH. /dev/log 被 syslogd 
服 和 著 回 所 使 用 。 想 昔 记 录 日 志 的 程序 只 要 给 地 址 为 /dev7log 的 socket 发 送 数 据 报 就 行 了 。 
地 赴 / dev/ printer 被 一 些 打 印 系 统 使 用 。 


13.9.2 H Unix 域 socket 编程 


为 了 学 习 Unix 域 socket 的 客户 /服务 器 编程 ,这 里 编写 了 一 个 日 志 系统 。 文 件 wtmp 
就 是 日 志 系 统 的 … 个 实例 。 文 件 wimp 记录 系统 的 所 有 登录 .退出 以 及 连接 。 日 志 系 统 被 保 
证 安全 和 系统 维护 的 程序 所 使 用 ,用 来 记录 一 : 些 可 绛 行为 。 日 志 服 务 器 是 一 个 抄写 员 ; 客户 
发 送信 息 给 服务 器 ,服务 器 将 这 些 信息 保存 到 只 有 自己 可 以 修改 的 文件 中 。 日 志 服 务 器 可 
以 用 任何 格式 保存 该 诡 件 ,客户 并 不 知道 这 些 约 节 。 

这 里 的 日 志 服 务 器 使 用 Unix 域 socket 地 址 。 只 有 同一 台 主 机 上 的 客户 才能 发 消息 给 
U. 下面 是 客户 和 服务 器 的 代码 。 服 务 器 先 创建 socket, 然 后 线 定 地 址 ， 


JOROROEOXOR UON ER EMER HREM RAR KHMER MERE RE KE MER KER EGER ERG EX 
* logfiled.c — a simple logfile server using Unix Domain Datagram Sockets 

+ usage, logfiled 7-7» logfilename | 

af 


# include  «—stdio.h— 

H include  «—sys/types. h> 
# include <(sys/socket. h> 
# include <(sys/un. h>> 


Ë include «time. h> 


| +#define MSGLEN 512 
it define oops(m,x} | perror(m); exit(x); | 


H define SOCKNAME "/tmp/logfilesock" 


int main(int ac, char * av[ |) 


( 
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int Sock; /* read messages here x/ 
struct Sockaddr un addr; . /* this is its address x/ 
socklen t addrlen; 

char msa[ MSGLEN | ; 

int 1; 

char socknamei = SOCKNAME ; 

time t now; 

int msqnum = Ü; 

char * timestr; 


/* build an address »/ 
addr.sun family - AF UNIX; /* note AF UNIX «/ 
strcpy(addr.sun path, sockname); /* filename is address + / 


addrlen = strlen(sockname) + sizeof(addr.sun family); 
sock = socket(PF UNIX, SOCK DGRAM, 0); /* note PF UNIX x/ 
if ( sock == -1) 
oops{ "socket", 2); 
/* bind the address «/ 


if ( bind(sock, (struct sockaddr x ) &addr, addrlen) == -1) 
oopst "bind", 3); 


fx read and write «/ 


while(1} 

í 
l = read{sock, msg, MSGLEN) ; /* read works for DGRAM «/ 
msg([1] = '\0'; . /* make it a string «/ 
time(&now); 


timestr = ctime(&now); 


timestr[strlen(timestr) - 1^ = 'X0'; /* chop newline x/ 


printf("| $5d] $s %s\n", msqnum++ , timestr, msg); 
fflush(stdout), 


这 里 仍 使 用 socket 和 bind 来 创建 服务 器 socket, socket 的 类 型 是 SOCK DGRAM ,地 
址 族 是 PF UNIXO, socket 地 址 是 文件 名 。 使 用 read 而 不 是 recvifrom, 因 为 不 需要 应 管 。 
下 面 是 客户 端 程序 ， 


JEGCE RR ON MARKO KON EXON MX KORO€ X X ERE MER X X OX A X £X Ko K X Ko RRR RR KR K OX Xo HE Xx X X RK REE RE 
* logfilec.c - logfile client - send messages to the logfile server 


* usage: logfilec "a message here" 





Q PF LOCAL 也 许 能 替代 PF UNIX, 
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# include  «—stdio.hl 
f include «sys/types.h— 
# include  «sys/socket.ho 
S include x sys/un.hz- 
Ë define SOCKET “/tmnp/leqfilesock” 
+ define oops(m,x) i perror(m); exittx); | 


main(jnt ac, char » avl D 
i 
int 


struct sockaddr_un addr; 


Sock; 


socklen_t addrlen; 
char sockname[ ] = SOCKET 
char *msg = av[1]; 


if eac l= 2231 
fprintt( stderr , usage. logfilec 
exit (1): 

} 


anck 


if ( sock == -1) 


oops( "socket", 25: 


addr. sun family = AF UNIX; 
strcpy(addr.sun path, sockname); 


addrlen 


if ( sendto(sock,msg, strlen(msg), 0, 


oops("sendto",3); 


这 里 使 用 socket BOK EE socket, 3Í 


H 


'message'Nn") ; 


socket(PF UNTX, SOCK DGRAM, 0); 


strien(sockname) + sizeof(addr.sun family) ; 


&addr, addrlen} == 一 1 》 


F 日 使 用 sendto 发 送 消息 。 服 务 器 接收 消息 ,然后 











打印 消息 。 消 息 前 面 是 销 息 编导 和 时 间 。 
下 面 是 测试 的 情形 ， 


$ oc logfiled.c -o logfiled 

$ ./logfiled “=> visitorlog: 

1500 

cc logfilec.c - o logfilec 

. /legfiles ‘Nice system. Swell softwar 
./logfilec "Testing this log thing. " 
./logfilec "Can you read this?" 

cat vistorlog 


$ 
$ 
8 
$ 
$ 
[ ©] Mon Aug 20 18,25,34 2001 Nice systel 


ef? 


m. Swell software! 
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[ 1] Mon Aug 20 18,25,44 2001 Testing this log thing. 
L 2] Hon Aug 20 18,25,48 2001 Can you read this? 





上 述 两 个 程序 展示 了 如 何 使 用 Unix 域 socket 以 及 日 志 服 务 器 的 基本 思想 。 程 序 的 另 
一 个 特征 是 实现 了 自动 追加 功能 ,但 没有 使 用 O_APPEND。 服 务 器 接收 消息 ,然后 把 消息 
追加 到 文件 末尾 。 即 使 有 多 个 客户 同时 发 送 消 息 ,底层 的 socket 机 制 会 负责 消息 的 序列 化 ， 


13.10 ”小结 : socket 和 服务 器 


socket 对 于 进程 辣 的 数据 通信 和 是 强大 的 .万 能 的 士 具 。 这 里 学 习 了 两 种 socket 和 两 种 
socket 地 址 。 














"m 
© socket PF INET B — PF UNIX 
SOCK STREAM 连接 的 ,路 机 器 连接 的 ,本 地 
SOCK_DGRAM 数据 报 , 跨 机 器 煞 据 报 ,林地 


在 前 面 的 儿 章 中 ,已 经 学 习 了 使 用 这 4 种 组 合 中 的 3 种 socket 的 项 目 。 当 考虑 Unix 的 
”网 络 编程 各 准备 虚 计 自己 的 项 目 时 ,可 以 考虑 使 用 这 张 表 格 中 的 技术 。 根 据 发 送 消息 的 类 
型 以 及 消息 发 送 的 距离 来 选择 最 住 的 技术 。 


小 结 


1. 主要 内 容 
数据 报 是 从 一 个 socket 发 送 到 另 一 个 socket 的 短 消息 。 数 据 报 socket 是 不 连 按 的 ， 
每 个 消息 包含 有 目的 地 址 。 数 据 报 5UDP)socket 更 加 简单 .快速 ,给 系统 增加 的 负荷 
更 小 。 
许可 证 服务 器 是 用 来 对 被 许可 程序 实施 许可 证 验证 规则 的 。 许 可 证 服务 器 发 布 许 
可 ,以 短 消息 的 形式 发 送 给 客户 。 
许可 证 服务 器 必须 记 住 娜 个 进程 使 用 了 如 张 票据 ,必须 维持 一 个 内 部 的 数据 库 。 因 
此 ,许可 证 服务 器 不 同 于 本 书 的 Web 服务 器 。 
记录 系统 状态 的 服务 器 必须 设计 成 可 以 处 理 服 务 器 和 客户 端的 朋 淡 事件 。 
有 些许 可 证 服务 器 为 一 个 网 络 虐 的 多 个 机器 提供 服务 。 有 几 种 设计 方法 ,各 有 优 
socket 可 以 有 两 种 类 型 的 地 址 ; 网 络 或 本 地 。 本 起 的 socket 地 址 叫做 Unix 域 
socket RA F socket。 这 种 socket 使 用 文件 名 作为 地 址 ,只 能 在 一 台 机 器 上 交 主 
数据 。 

2. 下 一 步 的 工作 

本 章 学 习 了 两 种 服务 器 处 理 多 个 请 求 的 方法 。 许 可 证 服务 器 接收 数据 报请 求 , 并 且 一 
次 一 条 地 返回 消息 。Web 服务 器 接收 数据 流 消息 ,并 且 使 用 fork 同时 应 答 所 有 请 求 。 服 务 
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器 有 另外 的 选择 ; 一 个 单一 进程 可 以 使 用 线程 的 技术 同时 运行 几 个 函数 。 下 一 章 将 学 习 有 
关 线 程 的 思想 和 技术 。 


3, 习题 


13.1 


13.2 


13.8 


13.9 


— 
ta 


在 使 用 流 socket 的 例子 中 ,服务 器 给 客户 应 答 时 ,并 设 有 使 用 客户 端的 地 址 。 服 
务 器 是 如 何 知道 给 哪个 地 址 的 客户 发 消息 的 ? 


进程 25915 是 如 何 战胜 进程 25914 AIRE? 考虑 每 个 寄 户 进程 的 创建 和 服 
Fy ae Sit TOK BY GA AUR TEE. TES IES RAD BRST. LER TE IL 
以 被 中 断 从 而 得 到 测试 的 结果 ? 


如 何 使 用 一 个 许可 证 服务 器 处 理 2 个 或 更 多 的 程序 的 请 求 ?一 种 方法 是 修改 协 
议 使 得 每 个 请 求 包含 所 要 运行 的 程序 名 。 描 述 可 以 支持 多 程序 协议 的 数据 结构 
ABER. l 

当 服 务 器 正在 处 理 客户 请 求 时 ,如 果 函 数 ticket_reclaim HAA, ESANERA] 
表 存 在 潜在 的 破坏 ? 考虑 函数 中 每 个 更 改 数组 和 计数 器 的 地 方 。 在 哪 一 点 上 数 





_ 组 的 状态 和 计数 做 的 值 不 一 致 ? 处 理 函 数 是 如 何 修改 数组 和 计数 器 的 ? ix nf 


的 一 个 未 预测 的 改变 对 常规 处 理 函 数 有 何 影响 ? 


当 进程 被 创建 时 ,进程 ID 被 分 配给 进程 。 考 虑 下 而 的 时 间 序 列 , 一 个 进程 ID 为 
777 的 客户 得 到 票据 后 崩溃 了 。 不 外, 一 个 不 同 的 用 户 运行 程序 创建 了 一 个 新 的 
进程 ,进程 ID 丛 好 也 是 777。 当 ticket_reclaim 税 序 运行 时 , 它 发 现 了 进程 777. 
即使 现在 编号 为 777 的 进程 是 一 个 不 相关 的 程序 ,并 日 不 持 有 六 据 ,分 配给 原来 
进程 777 的 票据 也 不 能 被 回收 。 当 这 种 情形 出 现时 ,该 如 和 何 处 理 ? aE 
事件 的 发 生 。 l 


一 种 防止 票据 数组 二 和 失 的 方法 是 服务 器 将 数据 写 到 磁盘 文件 中 。 如 提要 适应 这 
种 备份 机 制 ,该 如 何 改变 服务 器 ? 假设 客户 会 故意 杀 死 服务 器 以 得 到 更 多 的 票 
据 , 那 么 这 里 的 文件 备份 机 制 在 此 种 情形 下 该 如 何 工作 ? 


持 有 早期 版 本 票据 的 客户 在 等 待 了 较 长 的 时 间 后 来 验证 票据 ,可 能 发 现 已 经 没 
有 更 多 的 可 用 票据 了 。 为 这 种 情形 设计 -种 应 管 ,使 得 客户 不 允许 继续 运行 , 因 
为 这 将 破坏 最 大 同时 运行 进程 的 数目 ,但 要 求 客 户 不 能 突然 退出 ， 


参 焉 本 章 中 列 出 的 问题 ,比较 三 种 分 布 式 许可 证 服务 器 模型 。 





使 用 socket 时 ,可 以 用 write 和 sendto 来 发 送 数 据 。 阅读 send Al sendmsg AY E 
Ba JU «Jes PRS BE E PUE FF KB? 


.10 轿车 管理 系统 与 数据 报 不 只 是 比喻 设想 每 部 轿车 都 装 有 GPS 设备 。 一 个 计 


算 机 可 以 通过 modem 连接 到 Internet, 使 得 可 以 定位 轿车 的 位 置 。 设 想 轿车 的 
启动 不 是 受 钥匙 控制 ,而 是 通过 一 个 磁卡 的 登录 来 控制 。 设 计 一 个 允许 雇员 登 
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4. 


13. 


13. 


13. 


13. 


13. 


13. 


录 到 系统 来 使 用 轿车 ,并 且 管 理 员 可 以 跟踪 司机 行驶 路 线 以 及 定位 轿车 位 置 的 
系统 。 


编程 练习 


ll 


18 


. 20 


21 


更 改 程序 dgrecv. c, 要 求 不 仅 打 印 出 发 送 者 的 地 址 和 消息 接收 的 时 间 , 还 要 打印 
消息 编号 。 消息 标号 从 0 开始 。 希 望 得 到 的 输出 如 下 : 

dgrecvigot a message ; testing 123 

from; 10.200.75,.200,1041 

at Sun Aug 19 10;22,27 EDT 2001 

msg # 23 


为 dgsend, c 增加 客户 程序 dgrecv2. c, 


许可 证 服务 器 在 一 张 表 中 作 有 窜 户 拥有 票据 的 信息 。 如 果 想 要 服务 器 打印 这 
HS ,该 如 何 操作 ? 看 到 表 的 信息 有 助 于 排 错 或 测试 服务 器 。 一 称 标 准 的 和 
服务 器 通信 技术 是 使 用 信号 。 





更 改 程序 lservl 使 得 它 在 接收 信号 SIGHUP 时 ,打印 出 表 的 内 容 。 可 以 通过 命 


令 kill — HUP serverpid 来 测试 该 特征 。 


更 改 许可 证 服务 器 使 得 它 只 在 一 个 客户 的 请 求 被 拒绝 时 , 才 调 用 ticket_reclaim 
程序 。 该 方法 的 优 缺 点 各 是 什么 ? 


更 改 lclnt2.¢ 程序 ,使 它 睡眠 5 秒 钟 后 验证 页 据 。 如 果 和 票据 合法 ,客户 再 睡 也 5 


- 秒 钟 ,然后 退出 并 归还 票据 。 如 果 票 据 不 合法 ,客户 尝试 请 求 另 - SRR. MR 


成 功 , 继 续 正常 操作 。 如 果 失 败 , 告 诉 用 户 许可 证 服务 器 出 错 然后 再 退出 。 


更 改 前 面 章 节 中 编写 的 shell AF Al bounce 程序 ,使 用 许可 证 服务 器 。 在 哪 增 
加 票据 验证 过 程 ” SRAN ,票据 不 可 用 了 ,该 和 用 户 说 什么 ? 


更 改 客户 服务 器 代码 使 得 票据 包含 有 主机 IP 地 址 。 如 和 柯 改变 票据 列表 ? dedu 
对 验证 函数 也 做 了 改变 。 


实现 三 种 分 布 式 许可 证 控制 模型 的 一 种 。 


日 志 系 统 的 个 问题 是 其 中 的 消息 都 是 匿名 的 ,更 改 该 系统 使 得 请 息 包含 发 送 
消息 用 户 的 用 户 名 ， 


在 日 志 服 务 器 中 使 用 read。 编 写 两 个 新 版 本 的 服务 器 ,一 个 使 用 recvfrom, S 
一 个 使 用 reev。 这 些 获 取 数 据 的 方法 有 何不 同 ? 更 详细 的 信息 请 阅读 撞 助 
手册 。 


如 果 许 可 证 服务 器 和 客户 需要 使 用 Unix 域 socket, 需 要 做 何 改变 ?解释 客户 为 
什么 要 使 用 bind。 
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13.22 在 第 1 章 中 ,讨论 了 一 个 Internet 桥牌 游戏 。 在 任何 的 分 布 式 扑克 游戏 中 ,软件 
必须 模拟 一 个 扑克 牌楼 ,以 确保 两 个 客户 不 会 持 有 相同 的 扑 点 。 
编写 -- 对 程序 cardd 和 cardc ,使 用 数据 报 来 处 理 一 对 的 扑克 牌 。 启 新 时 服务 先 
洗 牌 , 接 下 来客 户 从 命令 行 思 动 , 就 可 以 从 服务 器 获取 扑克 牌 。 例 程 运行 如 下 ， — 
$ cardo get 5 
AD AH 20 TD KC 


结果 显示 客户 得 到 了 5 张 牌 ,-- 张 方块 4, 一 张 红 桃 A ,一 张 方块 2,- 一 张 方块 10， 
一 张 荆 。 确 保 程序 不 会 将 相同 的 扑 死 牌 发 给 两 个 用 户 机 ,并 且 协 议 要 有 途径 表 
AW dealer 何 时 发 完 牌 。 考 虑 一 下 还 有 其 他 什么 有 用 的 事务 可 以 作为 协议 的 
补充 ? 





9. 项 目 
基于 木 章 的 内 容 , 可 以 学 习 编写 下 面 的 Unix 程序 ， 
talk.rwho,P i pkER BS 














概念 与 技巧 

* 程序 的 执行 路 线 

+ 多 线程 程序 

- 创建 及 销毁 线程 

” 使 用 互 斥 锁 礼 制 保证 线程 问 数据 的 安全 共享 
”使 用 条 件 变量 同步 线程 间 的 数据 传输 

+ 传递 多 个 参数 给 线程 

相关 的 系统 调用 与 函数 


* pthread create, pthread join 





* pthread mutex lock. pthread mutex unlock 


* pthread cond wait,pthread cond signal 


14.1 同一 时 刻 完成 多 项 任务 


不 知道 你 是 否 经 常会 被 一 些 充 满 了 闪烁 .跳动 或 者 旋转 图 片 的 网 页 弄 得 很 不 舒服 ,不 过 
我 确实 不 喜欢 它们 。 然 而 尽管 这 些 网 页 让 人 很 烦 ,它们 却 引 发 了 一 个 技术 癌 题 ; 一 个 程序 如 
何 才 能 在 同一 时 刻 完成 多 个 任务 呢 ? 

动 曾 图 片 并 不 是 惟一 可 以 完成 并 发 功能 的 Web 程序 。 想 想 看 自 常 生活 中 的 浏览 器 , 它 
可 以 从 不 同 的 服务 器 上 下 载 并 且 解 压缩 图 片 。 浏 览 器 并 行 地 完成 这 么 多 的 任务 ,而 非 一 项 
接 一 项 地 做 ,那么 它 又 是 如 何 辣 时 下 载 并 解压 这 些 图 片 的 ? 

多 人 在 务 系统 的 问题 在 本 书 中 早已 介绍 过 了 。 视 频 游戏 那 一 意 , 使 用 计时 髓 和 两 个 计数 
器 在 两 维 空间 中 控制 图 片 的 动作 。 其 他 的 章节 也 曾 用 fork 和 exec 创建 新 进程 的 方法 处 理 
并 发 程序 ,从 而 实现 一 个 Web 服务 器 的 功能 。 那 么 这 里 为 何不 用 这 种 方法 呢 ? 

书 中 曾 使 用 fork 和 exec 同时 运行 多 个 程 译 。 如 昌 希 望 司 时 运行 几 个 画 数 ,或 普 则 时 对 
一 个 函数 调用 很 多 次 , 那 该 怎么 办 呢 ? 

本 章 将 介绍 线程 。 线 程 相对 于 函数 就 类 似 于 进程 相对 于 程序 ,后 者 为 前 者 提供 了 运行 
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环境 。 很 多 函数 可 以 同时 运行 ,但 它们 都 在 相同 的 进程 中 。 

本 章 主 要 的 项 吓 是 完成 一 个 程序 让 文本 框 中 出 现 本 断 姥 到 的 文字 。 这 里 将 先 修改 以 前 
的 那个 Web 服务 器 程序 ,让 它 不 启动 新 的 进程 即 可 处 理 访 向 目录 列表 以 及 文件 内 容 的 并 发 
14.2 HR PET EE EX 

什么 是 线程 ? AMA? 又 如 何 去 创 建 它 呢 ? 首先 看 下 面 的 一 个 传统 的 程序 ,在 此 程序 


中 ,指令 一 条 接 一 条 的 顺序 执行 。 然 后 ,只 要 将 此 程序 做 两 个 小 的 改动 , 即 可 让 程序 并 行 的 
Tut PET BRE 


14. 2.1 一 个 单线 程 程序 


/* hello single.c - a single threaded hello world program */ 





# include —stdio. h> 
H define NUM 5 


main() 
1 
void print msg(char * ); 


print msg(("hello"); 
priat msg(("worldin"); 
} 
void print msg(char x m) 
{ 
ink i; 
for (i=0 ; i-NUM ; i++)! 
printf¢¢"% sg", m); 
fflush(stdout); 
sleep(1); 


t 


在 hello single. c H, main 画 数 顺序 地 调用 了 两 个 函数 。 每 个 函数 执行 了 一 个 振 环 。 
下 面 的 输出 结果 反映 了 程序 的 控制 流 ; 


$ cc hello single.c ~ o hello single 
5 ./hello single 
heiloheilohellohelloheliloworid 
world ` 

world 

world 


world 
3 
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上 面 的 每 一 行 输出 之 间 都 有 一 个 1 秒 钟 的 时 延 ,程序 共 运行 了 10 秒 。 图 14. 1 展示 了 此 
程序 的 执行 流程 。 


执行 路 径 


一 个 进程 
两 个 函数 
一 个 线程 





图 14.1 单 执 行路 径 


首先 ,执行 路 径 进 入 main 函数 ,然后 进入 函数 print_msg。 接 着 ,从 print msg 中 返回 到 
main, 之 后 再 一 次 进入 print_msg 函数 进行 第 二 次 的 函数 调用 。 所 有 指令 执行 完毕 后 ,从 
main 中 返回 。 

不 间断 地 跟踪 指令 执行 的 路 径 在 这 里 被 称 做 执行 路 线 (thread of execution), 传统 的 程 
序 只 有 一 条 单独 的 执行 路 线 。 就 算是 包含 有 goto 语句 以 及 递归 子 程序 的 程序 也 只 有 一 条 执 
行路 线 ,尽管 这 条 路 线 有 时 有 些 弯 弯 绕 绕 。 


14.2.2 一 个 多 线程 程序 


如 果 想 同时 执行 两 个 对 于 print. msg 函数 的 调用 ,就 像 使 用 fork 建立 两 个 新 的 进程 一 
样 , 那 该 怎么 办 呢 ? 这 种 思想 清楚 地 体现 在 图 14.2 中 。 


原始 线程 





14.2 多 执行 路 径 的 程序 


首先 ,一 条 执行 线路 进入 main 函数 。 初 始 的 线路 新 建 了 一 条 新 的 执行 线路 来 运行 函数 
print_msg。 初 始 线路 继续 执行 下 一 条 指令 从 而 新 建 了 另 一 条 线路 来 对 print. msg 函数 进行 
第 二 次 的 调用 。 最 后 ,初始 线路 等 待 两 条 新 的 线路 加 入 自己 ,再 从 main 函数 中 返回 。 

人 们 无 时 无 刻 不 在 进行 着 这 种 多 线程 的 任务 管理 。 如 果 父 母 需要 做 许多 琐事 ,他 们 通 
常会 带 上 孩子 一 起 去 。 父 母 让 一 个 孩子 到 杂货 铺 买 牛奶 , 另 一 个 孩子 去 图 书馆 还 书 。 最 后 
等 两 个 孩子 都 回来 之 后 ,大 家 再 一 起 回 家 。 

一 个 线程 就 类 似 于 上 例 中 帮 父 母 做 事情 的 一 个 孩子 。 如 果 想 同时 完成 许多 事情 ,最 好 
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多 带 几 个 该 子 -起 去 ,类 位 地 ,如 果 - 一 个 程序 希 记 同时 执行 很 多 函数 , 它 必 须 创 建 多 个 线 
程 。 下面 的 这 个 程序 helio multi. c 将 图 14. 2 的 思想 实现 了 。 


/* hello multi.c 一 a multi- threaded hello world program #/ 


# include =<letdio. ho 
# include <(pthread. h> 
t define NUM 5 

maint} 

了 


^ 


pthread t tl, tZ: /* two threads x/ 
void x print msg(void x }; 


pthread create(&t1, NULL, print msg, (void # )"hello"); 
pthread create(&t2, NULL, print msg, (void = )"world\n'; 
pthread join(tl, NULL); 

pthread join(t2, NULL); 


void » print msq(void * m) 


í 
char *cp = (char * ) m; 
int i; 
for (i=0 ; ic NUM ; i++ ?1 
printf(" $s", m); 
fflushistdout), 
sleep(1); 
t 
return NULL; 
} 


注意 一 下 此 程序 与 原先 那个 程序 的 区 别 。 首 先 ,这 里 包含 了 一 -个 头 文件 pthread. h, € 
包含 了 数据 类 型 的 定义 和 鞠 数 的 原型 。 其 次 ,程序 中 定义 了 pthread t 类 理 的 两 个 变量 tl 和 
纪 。 这 两 个 线程 就 类 似 于 上 面 所 说 的 父母 办 事 时 所 带 的 两 个 孩子 。 

图 14. 2 控制 流 中 的 每 一 个 分 支点 都 对 应 了 如 下 的 一 行 代码 : 


pthread create(&tl,NULL,print msg,(void x )"hello") 


H 8E a FERAS TERE: E, AT FB hello 米 运 行 函数 print. msg," E i4 
一 个 参数 是 线程 的 地 址 ; 第 二 个 参数 是 指向 线程 属性 的 指针 ; 第 三 个 参数 是 所 要 执行 的 函 
数 和 名 称 ; 而 第 四 个 参数 则 是 指向 所 要 传递 给 函数 的 参数 的 指针 ，。 

这 条 指令 使 用 指定 的 属性 新 建 了 一 个 线程 ,而 此 线程 使 用 参数 hello 来 运行 函数 


print msg, 
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pthread_create(&t2 , NULL, print_msg, (void x )"world\n") 


此 函数 也 使 用 默认 的 属性 创建 了 -- 个 新 的 线程 。 新 的 线程 用 参数 world\n 来 运行 函数 
print msg, l 

iff PRX pthread join(t1, NULL); 类 似 于 父母 等 待 孩子 归来 一 样 ,main 借助 于 此 函数 来 
FEAT PATA FT I], PRK pthread_join 使 用 了 两 个 参数 。 第 一 个 参数 是 所 要 等 
符 的 线程 ,而 第 二 个 参数 则 是 一 个 指向 返回 值 的 指针 。 如 果 此 参数 为 NULL, 表 未 返回 值 不 
RFE. 

pthread_join(t2, NULL); 表示 main 函数 等 待 另 一 个 线程 返回 ， 

编译 此 程序 ,并 运行 ,输出 结果 如 下 : 

$ cc hello multi.c - lpthread - o bello multi 

$ ./hello multi 

helloworld 

helloworld 

helloworld 

helloworld 

helloworld 

$ 

此 程序 只 运行 了 5 秒 钟 ,因为 两 个 循环 并 行 的 执行 。 不 过 对 于 线程 调度 的 不 同 可 能 会 导 
致 输出 与 上 面 所 示 的 输出 不 同 。 大 家 可 能 已 经 注意 到 ,线程 的 使 用 是 多 么 的 灵活 。 在 这 里 
则 时 运行 了 同一 个 函数 的 两 个 不 同 实例 ,仅仅 参数 是 不 同 的 。 当 然 同时 运行 两 个 不 同 的 函 
数 也 是 一 样 的 容易 。 


14.2.3 EZAU 











pthread creute 














目标 创建 一 个 新 的 线程 

o3 4E ft include <i pthread. hz 

e m ER int pthread, create (pthread 1 * thread, 
pihread air 1 # attr, 
void * (x func) (void x ) 
void * arg? i 

参数 : thread 指向 prhread i25 KP ar Bt ADF EF 


atir -> 指向 pthread_attr_t 2 M de EE Bde £p ,或 者 为 NULL 
fune 指向 新 线程 所 运行 函数 的 指针 
arg 传递 给 func 的 参数 





返回 值 0 威 功 返 回 
errcode ”错误 
一 一 - 一 LL 
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pthread create 因数 创建 了 一 条 新 的 执行 线路 ,在 此 新 的 线程 内 调用 了 funclarg). A 
程 的 属性 由 attr 参数 来 指定 。func 是 一 个 函数 , 它 接收 一 个 指针 作为 它 的 参数 ,并 和 且 运 行 结 
束 后 返回 一 个 指导 。 参 数 和 返回 值 都 被 定义 为 类 再 为 void * 的 指针, 民 允 许 它 们 指向 任何 类 
型 的 值 ， 

wR attr AA NULL ,线程 使 用 的 是 默认 的 属性 。 下 一 - 章 中 将 讨论 线程 的 属性 。 
pthread create 如 果 和 运行 成 功 返 回 0, 否 则 返回 一 个 非 零 错误 代码 。 


Pthread join 

















目标 Ste EE ES 
ae # inelude < -prhread. ho 
函数 原型 int pthread_join(pthread_ 1 thread, void * x retval) 
参数 thread 所 等 待 的 线程 
retval CADE fr pi eR Rei e] f pg ar 
BE 0 成 动人 返回 
errcode 错误 





pthread join 使 得 调用 线程 挂 起 直至 由 thread 参数 指定 的 线程 终止 。 如 果 retvai 不 是 
nall ,线程 的 返回 值 就 将 存储 在 由 revval 指向 的 变量 中 。 

当 线 程 终 止 时 ,pthread_join 函数 返回 0, 如 果 有 错误 发 生 , 则 返回 一 个 非 零 错 误 代码 ， 
如 果 某 线程 试图 等 待 一 个 并 不 存在 的 线程 .多 个 线程 同时 等 待 一 个 线程 返 四 或 者 线程 试图 
等 待 自己 都 将 导致 函数 返回 一 个 错误 代码 。 

使 用 线程 进行 编程 就 像 给 一 些 人 赋予 不 同 的 任务 。 如 果 导 强项 自 管 理 , 保 证 所 有 的 人 
都 能 够 按 序 办 事 ,不 和 别人 冲突 ,这 个 项 目 肯 定 会 提前 完成 。 下 面 将 介绍 可 以 使 线 程 分 工 全 
作 的 技术 。 





14.3 ”线程 间 的 分 工 合作 


进程 闻 可 以 通过 管道 ,socket,、 信 和 号 ,退出 /等 待 以 及 运行 环境 来 进行 会 话 。 线 程 间 的 通 
信也 很 容易 。 多 个 线程 在 一 个 单独 的 进程 中 运行 ,共享 全 局 变量 ,二 此 线程 间 可 以 通过 设置 
和 读 皮 这 些 全 局 变量 来 进行 通信 。 不 过 要 知道 ,对 共享 内 存 的 访问 可 是 线程 的 一 个 既 有 用 
又 极为 危险 的 特性 。 


14.3.1 fl 1- incerprint. c 
/* incprint.c — one thread increments, the other prints «/ 


# include «< stdio, h> 
# include < pthread. h> 


# define NM 5 
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int counter - 0; 


main() 

( 
pthread t t1; /* one thread «/ 
void *print count(void *); /x its function x/ 
int i; 


pthread create(&tl, NULL, print count, NULL); 
for(i- 0; i<NUM; i++ ){ 

counter ++ ; 

sleep(1); 
} 


pthread. join(t1, NULL); 
} 
void * print_count(void x m) 
{ 
int i; 
for (i=0 ; i<NUM; i++){ 
printf( "count = %d\n" , counter); 
sleep(1); 
) 
return NULL; 
} 


程序 incprint. c 使 用 了 两 个 线程 。 初始 线程 执行 了 一 个 循环 来 使 计数 器 值 每 秒 钟 增 1。 
初始 线程 在 进入 循环 之 前 ,创建 了 一 个 新 的 线程 = 新 的 线程 运行 了 一 个 函数 来 将 counter 的 
值 打印 出 来 。main 函数 和 print. count 函数 运行 在 同一 个 进程 中 ,所 以 都 有 对 于 counter 的 
访问 权 。 图 14.3 展示 了 两 个 函数 和 全 局 变量 的 内 在 逻辑 。 


=] of D 


print count () 





图 14. 3 ”两 个 线程 共享 全 局 变量 


当 main 函数 改变 了 counter 值 之 后 *Print counter 函数 立即 可 以 访问 到 新 的 值 。 因 此 
并 不 需要 通过 管道 或 者 套 接 字 等 方法 传送 新 的 值 。 编译 这 个 程序 ,然后 运行 它 ,结果 如 下 ， 


$ cc incprint.c - lpthread -o incprint 
$ ./incprint 
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count 
count 
count 


count 


Mu LI " u LU 
uU RUN m 


count 


程序 显然 可 以 正常 工作 。 一 个 函数 修改 了 变量 , 另 一 个 函数 读 取 并 显示 了 变量 的 值 。 
这 个 例子 展示 了 如 何 使 运行 在 不 同 线程 中 的 函数 共享 全 局 变量 。 不 过 下 个 例子 还 要 有 趣 。 


14.3.2 例 2: twordcount. c 


很 多 学 生 都 有 这 样 的 经 验 ,对 着 电脑 数 自己 学 期 论文 的 字数 以 确定 字数 是 不 是 足够 。 
假设 一 个 学 生 有 一 篇 10 页 纸 的 论文 , 它 有 两 种 方法 来 计算 这 篇 文章 的 字数 。 一 种 是 一 个 字 
一 个 字 地 数 了 10 页 纸 , 另 一 种 方法 是 找 10 个 同学 来 ,给 每 个 同学 一 页 纸 * 让 他 们 分 别 计 算 ， 
然后 将 结果 累加 起 来 。 显 然 并 行 地 计算 这 10 页 纸 的 字数 的 方法 会 快 很 多 。 

Unix 平台 上 的 we 程序 的 作用 是 计算 一 个 或 多 个 文件 中 的 行 . 单 词 以 及 字符 个 数 。 不 
过 wc 是 一 个 典型 的 单线 程 程序 。 怎 样 来 设计 一 个 多 线程 程序 来 计数 并 打印 两 个 文件 中 的 
所 有 字数 呢 ? 

。 版 本 1: 两 个 线程 一 个 计数 器 

第 一 个 版 本 程序 创建 分 开 的 线程 来 对 每 一 个 文件 进行 计算 。 所 有 的 线程 在 检查 到 单词 
的 时 候 对 同一 个 计数 器 增值 。 图 14. 4 体现 了 这 个 思路 。 





图 14.4 两 个 线程 共享 一 个 通用 计数 器 
此 版 本 的 代码 包含 在 文件 twordcountl. c "P, 


/* twordcountl.c - threaded word counter for two files. Version 1 */ 


# include — stdio. h> 
# include < pthread. h> 
f include < ctype. h> 


int total words ; 


main(int ac, char * av[]) 
{ 
pthread_t tl, t2; /* two threads */ 
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} 


void *comt words(void x); 


if fac t= 3) 
printf("usage; %s filel file2\n", av| 0:5; 
exit(1): 
} 。 
total words - 0; 
pthread create(&t1, NULL, count words, (void *  av[1]; 
pthread create(&t2, NULL, count words, (void *) av[2] ; 
pthread join(tl, NULL); 
pthread join(t2, NULD); 
printf(" $ 5d, total words\n", total words); 


void * count words(void » f) 


{ 


} 


char s filename = (char x) f; 
FILE * fp; 


int c, preve = "\O'; 


if ( (fp = fopen(filename, "r™)) f= NULL )! 
while( ( c = getc(fp))t= EOF | 
if( ! isalnum(c) && isalnum(prevc) ) 
total words ++ ; í 
prevc = c; 
t 
fclose(fp): 
} else 
perror( filename) ; 
return NULL; 


函数 count words 有 是 这 样 区 分 单词 的 : 凡是 一 个 非 字母 或 数字 的 字符 跟 在 字母 或 数字 
的 后 面 ,那么 这 个 字母 或 数字 就 是 单词 的 结尾 。 当 然 这 种 思路 忽略 了 文件 的 最 后 一 个 单词 ， 
并 且 还 把 “U. S. A. ”看 成 三 个 独立 的 单词 .编译 此 程序 并 按照 如 下 的 方法 进行 测试 ， 


5 cc twordcountl.c - lpthread - o twel 


$ ./twcl /etc/graup /user/dict/words 
45614, total words 


Swe -w /ete/group /usr/dict/words 


58 /etc/group 
45402 /user/dict/words 
45460 total 


twordcountl 产生 的 结果 与 we 并 不 相同 ,因为 两 个 程序 对 于 单词 结尾 规则 的 定义 不 同 ， 
这 里 还 有 一 个 比 单词 结尾 更 加 微妙 的 问题 , 所 有 线程 对 同一 个 计数 器 进行 操作 ,并且 在 
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同时 进行 。 细 心 的 读者 也 许 会 问 : 这 样 会 不 会 有 问题 啊 ? 语言 并 没有 指定 操作 total_ 
words 十 + 是 如 何 被 计算 机 执行 的 。 计 算 机 有 可 能 执行 的 是 这 样 一 个 操作 





total words = total words + 1 


也 就 是 说 ,程序 先 将 计数 器 当前 的 值 存 人 寄存 器 中 ,如 1 操作 后 , 肯 将 其 恢复 到 内 存 中 。 

闭 么 如 果 所 有 线程 在 同一 时 刻 都 使 用 “取出 - 加 一 存储 ”的 序列 来 完成 对 计数 器 的 操 
fF ARRUME? 

图 14. 5 Bras BO E Bo RTE h I) Ea p Sao RG BK A RHE., PK 1 
SR TE FI EACH A a A RE KOR. MT ER UE UE AS et 
方 工作 呢 ? 下 面 将 采用 两 种 办 法 进行 党 





time 
































Thread ] Thread 2 

: tortal words get value tron variable 

» get value trom variable Pee T 
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图 14.5 两 个 线程 对 同 … 个 计数 器 进行 操作 


”版 本 2: 两 个 线程 .一 个 计数 器 .一 个 互 斥 量 

大 家 注意 到 在 机 场 或 者 公交 车 终点 站 的 公共 存 情 柜 始终 是 打开 的 ,除非 有 人 在 里 面 
存 了 东西 。 当 … 个 人 扔 了 僻 币 然后 拿 到 了 钥匙 之 后 , 便 没 有 别人 可 以 再 去 打开 那个 柜子 
了 。 只 有 等 到 这 个 人 归还 了 钥匙 ,把 柜子 打开 之 后 ,其 他 人 才 可 以 再 去 使 用 。 类似 地 ,如 
果 两 个 线程 需要 安全 地 共享 一 个 公共 的 计数 器 ,它们 也 需要 这 样 一 种 方法 把 变量 加 锁 。 

线程 系统 包 全 了 称 为 互 斥 锁 的 变量 , 它 可 以 使 线程 间 很 好 的 合作 ,避免 对 于 变量 ,函数 
以 及 资源 的 访问 冲突 。 下 面 的 程序 twordcount2. c 将 告诉 大 家 如 何 创建 和 使 用 互 斥 量 ， 





/* twordcount2.c — threaded word counter for two files. af 
fe version 2, uses mutex to lock counter */ 

# include «stdio. h> 

# include << pthread. hz» 

# include <i ctype. h> 


int total words ; /* the counter and its lock «/ 


pthread mutex t counter lock = PTHREAD MUTEX INITTALIZER; 


main(int ac, char « av[ D 
i 
pthread t tl, t2; /* two threads */ 


void * count words(void «); 


if Cacl= 3 71{ 
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printf("usage; % s filel file2\n", av# [0]; 
exit(1); 
} 
total words - [0]; 
pthread create(&tl, NULL, count words, (void * ) av[1]); 
pthread create(&t2, NULL, count words, (void * ) av[2]); 
pthread join(tl, NULL); 
pthread join(t2, NULL); 
printf(" $& 5d; total words\n", total words); 
} 
void * count words(void * f) 
{ 
char * filename = (char #x ) f; 
FILE x fp; 


int c, prevc = '\0'; 


if ( (fp = fopen(filename, "r"))!- NULL )| 
while( ( c = getc(fp))!= EOF ){ 
if ( | isalnum(c) && isalnum(prevc) ){ 
pthread mutex lock(&counter lock); 
total words ++ ; 
pthread mutex unlock(&counter lock); 
} 
prevc = c; 
} 
fclose(fp); 
} else 
perror(filename); 
return NULL; 
) 


此 程序 的 逻辑 类 似 于 图 14. 6 所 示 。 
一 个 进程 细心 的 读者 可 以 发 现 , 在 原来 的 程序 中 仅仅 加 
， 一 个 计数 器 ”了 三 行 代 码 。 首 先 定义 了 一 个 pthread_mutex_t 类 
型 的 全 局 变量 counter lock, 然后 赋 给 它 一 个 初 值 。 
另外 改动 的 地 方 就 是 把 对 于 count. words 的 操作 夹 
TEXT BH 4S PRX pthread  mutex lock 以 及 pthread - 
mutex unlock 的 调用 之 间 。 
现在 两 个 线程 可 以 安全 地 共享 计数 器 了 。 当 一 
个 线程 调用 pthread mutex lock 的 时 候 , 如 果 另 一 





mie Dx 个 线程 已 经 将 这 个 互 斥 量 锁 住 了 , 那 这 个 线程 只 好 阻 
塞 等 待 着 这 个 锁 被 另 一 个 线程 解 开 后 , 才 可 以 对 计数 
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器 进行 操作 。 每 个 线程 对 计数 咽 进 行 操作 后 ,都 将 虑 帮 量 解锁 ,然后 循环 地 处 理 其 他 数据 。 
任何 数目 的 线 称 都 可 以 挂 起 等 待 互 乒 量 解锁 。 当 一 个 线程 对 互 乒 量 解锁 之 后 ,系统 就 

将 控制 权 交 给 等 候 的 兵 一 线程 ， 如 所 有 线程 都 按照 这 种 下 斥 原 则 进行 通信 时 ,五 斥 量 是 有 

用 的 ; 然而 如 果 一 个 线程 不 遵守 这 个 规则 ,直接 去 修改 计数 器 的 值 的 话 ,程序 员 也 无 能 为 力 。 








pthread mutex lock 























Hi (0 A&BIERUUOLHULBAMERUERE 
3k xcd # include =< pthread, hz 
函数 原型 int pthread, mutex lock(pthread mutex t * mutex ? 
参数 ^ mutex EEEE TIT | 
"Im | 0 "PIT 
errcode 错误 





pthread mutex lock 函数 用 来 锁 住 指定 的 末 斤 量 。 如 果 互 斥 量 明 开放 的 , 它 被 锁 企 ,并 
只 能 出 调用 线程 来 管理 。 如 果 此 时 互 斥 量 已 经 被 男 外 的 线程 锁 住 ,调用 线程 将 挂 起 等 待 此 
五 斥 量 被 解锁 。 如 果 调 用 过 程 中 山 现 错误 ,函数 将 返 问 一 个 错误 代码 ， 








pthread mutex unlock 





























目标 PTITUTm 

LAH # include <pthread, hz T 
函数 原型 int pthread, muitex unlock(pihread mutex t* mutex) 

参数 — mutex 指向 互 斥 锁 对 象 的 指 村 0 

A T nd i _ _ 


errcode 错误 





pthread mutex unlock 丙 数 给 指定 的 互 斥 量 解锁 。 如 果 丰 钱穆 挂 起 等 待 此 下 斥 量 ,其 
中 的 . -个 线程 将 获得 对 互 斥 锁 的 控制 权 。 若 解锁 成 功 ,此 了 滑 数 将 返回 0, 否则 返 癌 一 个 非 零 
的 错误 代码 ， 

不 过 上 面 讨 论 的 都 是 正常 的 情况 。 如 果 一 个 线程 试图 解锁 一 个 并 没有 被 锁 住 的 站 所 量 
那 会 怎么 样 ? 如 果 线 程 企图 对 一 个 已 经 锁 住 的 互 斥 量 加 锁 呢 9 又 如 果 一 个 线程 还 没有 对 自 
已 锁 住 的 开 斥 其 解锁 就 退出 了 ,那么 结果 交会 如 何 呢 ?不同 的 线程 系统 对 于 这 些 问题 的 处 
理 方 法 各 不 相同 。 详 情 请 参见 你 所 使 用 的 Unix 的 参考 手册 。 

dé 95 EDU Et? 如 果 多 个 线程 企图 在 同一 时 刻 修 改 相同 的 变量 ,它们 只 好 使 用 巨 斥 量 
来 避免 访 间 冲突。 然而 使 用 互 斥 量 使 得 程序 运行 速度 变 慢 。 对 所 有 文件 中 的 每 一 个 单词 者 
需要 执行 检查 ,设置 以 及 释放 锁 的 操作 ,这 使 得 程序 效率 低下 。 更 加 有 效 的 方法 是 为 每 个 线 
程 设置 自己 的 计数 器 。 

* 版 本 3: TRE ATTRA MARE RET SH 

F—TNBOEBISCEUCEEHERUT WEP RER BT ROME MRE UPR 
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如 何 来 得 到 这 些 线程 的 计数 器 ? MR rex PRE LR TTE CR iR DLE? 在 一 个 通常 的 
单线 程 程 序 中 ,字数 统计 函数 将 得 出 的 字数 返回 给 它 的 调用 霄 数 . 线程 可 以 通过 调用 
pthread exir 得 到 返 辐 值 ,这 个 返回 值 允 可 以 通过 pthread join 的 调用 被 原先 的 线程 得 到 。 
详情 可 以 参见 手册 。 下 面 将 使 用 一 个 稍微 简单 一 点 的 方法 。 

调用 线程 适 过 传递 给 函数 一 个 指向 某 变量 的 指针 ,让 苑 数 对 此 变量 进行 操作 ,从 而 可 以 
避免 让 线程 将 值 传 回 。 传 递 指针 引发 了 -个 问题 : 函数 pthread create 只 能 允许 传递 -个 
参数 给 晴 数 ,而 文件 名 又 必须 传 给 耳 数 ,都 么 如 何 传 这 个 指针 呢 ? 办 法 很 简单 ,只 需 建 -- 个 
包含 两 个 成 员 的 结构 体 ,然后 将 此 结构 体 的 地 址 传 给 冰 数 即 可 。 


/* twordcount3.c - threaded word counter for two files. 














* - Version 3, one counter per file 


af 


# include <“stdia, h> 
H include < pthread. hc 
# include < ctype. > 


struct arq set | /* two values in one arg «/ 
char * fname; /* file to examine +/ 
int count; /* number of words »/ 


te 
main(int ac, char * av[ D 


{ 


pthread t ti, t2; /* two threads x/ 
struct arg set argsl, arqs2; /* two argsets x/ 
void * count words(void x); 


if Cacl= 3) 
printf("usage, %s filel file2\n", avit k[O]; 
exit(l); 

} 

argsl.fname = av[1]- 

argsl.count = 0; 


pthread create(&tl, NULL, count words, (void * ) &argsl); 


F 


args2.fname = av[2]; 
args2.count = 0. 


F 


pthread create(&t2, NULL, count words, (void +) &args2); 


pthread join(tl, NULL); 

pthread join(t2, NULL); 

printf(" €5d; % s\n", argsl.count, av[1]; 

printf(" & 5d, $ sin", args2.count, av[2]); 

printf(" $ 5d, total words\n", argsl.ceunt + args2. count); 
1 


void + count words(void * a) 
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struct arg set * args = a; /* cast arg back to correct type «/ 
FILE * fp; 


int c, prevc = '\0'; 


if ( (fp = fopen(args- —fname, "r"))!= NULL ){ 
while( ( c = getc(fp))!= EOF ){ 
if ( | isalnum(c) && isalnum(prevc) ) 
args — >count ++ 
prevc = c; 
} 
fclose(fp); 
) else 
perror(args — >fname) ; 
return NULL; 
} 


这 里 通过 定义 一 个 以 文件 名 和 该 文件 中 字数 为 成 员 的 结构 体 解决 了 同时 传递 两 个 参数 
的 问题 。main 函数 定义 了 两 个 这 种 类 型 的 局 部 变量 ,并 将 这 两 个 变量 的 地 址 传 给 线程 (如 图 
14.7 所 示 )。 传 递 本 地 结构 体 指针 的 方法 既 避 兔 了 对 互 斥 量 的 依赖 ,又 消除 了 全 局 变量 。 


一 个 进程 


注意 : 这 里 并 没有 锁 





图 14.7 每 个 线程 都 拥有 一 个 指向 自己 结构 体 的 指针 


每 次 调用 函数 count_words 之 后 都 会 接收 到 一 个 指向 不 同 结构 体 的 指针 ,因此 线程 从 不 
同 的 文件 中 读 取信 息 ,并 对 不 同 的 计数 器 进行 增 1 操作 。 因 为 结构 体 是 main 中 的 局 部 变量 ， 
所 以 分 配给 各 计数 器 的 内 存 空间 在 main 函数 返回 前 一 直 保存 着 。 


14.3.3 线程 内 部 的 分 工 合作 : 小 结 


进程 的 数据 空间 包含 了 所 有 属于 它 的 变量 。 此 进程 中 运行 的 所 有 线程 都 拥有 对 这 些 变 
量 访问 的 权限 。 如 果 这 些 变 量 值 不 变 的 话 ,线程 可 以 无 误 地 读 取 并 使 用 它们 的 值 。 

不 过 如 果 进 程 中 的 任何 线程 修改 了 一 个 变量 值 ,所 有 使 用 此 变量 的 线程 必须 采用 某 种 
策略 来 避免 访问 冲突 。 在 某 一 时 刻 ,只 有 惟一 的 线程 可 以 对 变量 进行 访问 。 

字数 统计 程序 的 三 个 不 同 版 本 显示 了 三 种 不 同 的 方法 来 进行 线程 间 的 变量 共享 。 在 
twordcountl. c 中 使 用 的 第 一 种 方法 ,允许 线程 无 任何 合作 来 修改 同一 个 变量 。 这 个 程序 本 
身 存 在 着 很 大 问题 。 
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程序 twordcount2.c 中 使 用 了 第 二 种 方法 。 这 种 方法 使 用 一 个 下 斥 对 象 来 保证 在 某 一 
时 刻 , 只 有 惟一 的 一 个 线程 对 计数 器 进行 修改 。 此 程序 虽 热 解决 了 问题 ,但 是 由 于 对 设置 利 
释放 互 斥 锁 太 窗 的 调用 导致 了 系统 性 能 的 降低 。 

twordcount3. c 中 使 用 的 第 三 种 方法 是 一 种 改进 的 方法 。 此 方法 为 每 一 个 线程 创建 了 
各 自 的 计数 器 ,这 样 避免 了 共享 计数 器 的 麻烦 。 所 有 的 线程 不 需要 再 共享 一 个 变量 ,因此 也 
不 用 互相 合作 了 。 不 过 尽管 如 此 ,每 一 个 单独 的 线程 仍 需 和 原先 的 线程 进行 台 作 。 特别 地 ， 
原 线程 不 应 在 其 他 线程 返回 之 前 读 取 它们 各 自 计数 器 的 内 容 。 在 这 种 情况 下 , 诛 线 程 使 用 
pthread join 琐 数 使 自己 挂 起 直到 线程 已 返回 。 当 某 一 计数 线程 返回 的 时 想 , 对 于 pthread_ 
join 的 调用 激活 原 线 程 ,允许 其 访问 计数 器 并 且 也 告 沂 main 函数 该 是 读 取 计数 器 值 的 时 
BT. 

PS RAR DERE ET Wf feb B BU E RPR. BE AM 
AA E BE ALS BUS A SR PEE UO S5 M PR RS hf eG 。 TE E TI BEN E SU 
结构 体 中 的 任意 成 员 变量 了 。 任 何 访问 此 结构 体 的 函数 都 可 以 看 见 值 的 不 断 变化 。 当 然 ， 
如 果 不 止 一 个 线程 需要 修改 这 些 值 的 时 候 , 就 又 得 借助 于 互 斥 量 来 避免 访问 冲突 了 。 


14.4 线程 与 进程 


Unix 从 其 产生 伊始 就 将 进程 作为 它 的 重要 组 成 部 分 而 线程 是 后 来 才 加 进去 的 。 进 程 的 
概念 非常 清晰 旦 统一 。 而 线程 却 有 着 一 系列 的 起 源 , 它 们 的 属性 也 各 不 相同 。 这 里 的 例子 
用 了 一 个 叫做 POSIX 的 线程 接口 。 在 这 里 当然 忽 栈 了 效率 和 调 虚 的 问题 ,这 些 由 你 所 使 用 
的 Unix 版 本 和 线程 版 本 所 决定 。 

进程 与 线程 有 根本 上 的 不 同 。 每 个 进程 有 其 独立 的 数据 空间 ,文件 描述 符 以 及 进程 的 
ID。 而 线程 共享 一 个 数据 空间 .文件 描述 符 以 及 进程 JD。 下 面 这 些 概念 对 于 程序 员 来 说 是 
非常 重要 的 。 

(1) 共享 数据 空间 

这 里 考虑 一 个 在 存储 器 中 存 竺 了 巨大 而 复杂 的 椅 结 构 数据 闫 的 数据 库 系 统 。 多 个 线程 
可 以 轻易 地 读 取 到 这 个 共享 的 数据 集 。 客户 的 多 个 查询 可 以 由 一 个 进程 来 实现 。 如 果 变 量 
不 会 被 改变 ,共享 这 个 数据 空间 不 会 导致 件 何 问题 。 

再 考虑 一 个 使 用 malloc 和 free 系统 调用 来 管理 内 存 的 程序 .一 个 线 称 分 配 了 一 据 空 间 
存储 一 个 字符 申 。 当 此 线程 做 其 他 事情 的 时 候 , 另 一 个 线程 使 用 free ECT Ox AR ERI. AE 
么 原先 的 线程 中 本 来 指向 此 空间 的 指针 现在 指向 了 一 块 已 经 被 释放 的 地 方 , 更 糟糕 的 是 ,这 
块 地 方 已 经 被 派 上 别 的 用 处 了 ， 

线程 机 制 还 会 带 来 内 存 的 轩 积 。 程 序 员 往往 因为 怕 影 响 了 了 某 线程 正在 使 用 的 内 存 空 
间 ,只 分 配 而 不 释放 存储 区 域 ， 这 直接 导致 了 内 存 的 围 积 ,使 用 完毕 也 得 不 到 释放 ， 

在 单线 程 环境 中 返回 指向 静态 局 部 变量 的 指针 的 前 数 无 法 兼容 于 多 线程 环境 。 因 为 
同样 

的 函数 可 能 在 多 个 线程 中 同时 被 调用 而 导 比 结果 出 错 

简 而 言 之 ,如 果 共 享 的 变 基 很 多 且 定 义 的 不 好 ,调试 一 个 多 线程 的 应 ue Fe FP a Se EES 
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一 场 ， 
(2) 共享 的 文件 措 述 符 
在 fork 原 语 种 调用 之 后 ,文件 描述 符 自 动 地 被 复制 ,从 而 子 进 程 得 到 了 一 矢 新 的 文件 描 
述 符 。 在 子 进程 关闭 了 某 一 个 从 父 进程 那里 继承 来 的 文件 描述 符 之 后 ,此 描述 符 对 父 进 程 
来 说 仍然 是 打开 的 。 

在 允 线 程 程序 中 ,很 有 可 能 会 将 同一 个 文件 措 述 符 传递 给 两 个 不 同 的 线程 ，。 即 传递 给 它 

们 的 两 个 值 指向 同一 个 文件 描述 符 ， 显然 如 果 一 个 线程 中 的 函数 关闭 了 这 个 文件 ,此 
APER 

XR TOUT VELIE RE "P BO AE A eB EE EXE DHL. RA RB RS COE E 

(3) fork exec exit, Signals 

所 有 的 线程 都 共享 向 一 个 进程 。 如 果 一 个 线程 调用 了 exec, 系统 内 核 用 一 个 新 的 程序 
取代 当前 的 程序 从 而 所 有 正在 运行 的 线程 都 会 消失 。 并 和 且 如 打 一 个 线程 执行 了 exit BAR 
个 进程 部 将 结束 运行 。 想 想 要 是 线程 的 运行 导致 了 内 存 段 异常 或 者 系统 错误 或 是 线程 山 
演 , 瘫 况 的 是 整个 进程 ,而 不 是 某 个 线程 本 身 了 。 

fork 创建 了 一 个 新 的 进程 ,并 把 原 调用 进程 的 数据 和 代码 复制 给 这 个 新 的 进程 。 如 果 
oe PEP ASE wa T fork ,那么 其 他 的 线程 是 不 是 也 会 被 复制 给 新 的 进程 呢 ? SEERE 
的 ,只 有 调用 fork 的 线程 在 新 的 进程 中 和 运行。 试想 一 下 如 果 在 fork 发 生 的 时 刻 , 另 一 个 线程 
正在 修改 数据 , 那 结 果 如 何 呢 ? 在 什么 情况 下 这 些 数 据 会 被 复制 到 新 的 进程 中 呢 ? 

信和 号 量 (Signal) 的 使 用 要 比 线程 复杂 密 了 ， 进程 可 以 接收 任何 种 类 的 信和 号 量 。 那 么 哪 
些 线 程 可 以 收 到 信号 量 ? 是 不 是 所 有 线程 都 可 以 呢 % 如 果 这 些 信 和 号 量 是 由 内 存 段 异常 或 系 
统 错误 引发 的 又 将 如 何 ? 线程 与 信号 量 的 岗 节 可 参考 Unix 的 使 用 手册 ， 

(4) 动手 做 一 做 

这 一 章 介绍 了 线程 的 基本 知识 ,主旨 问题 以 及 多 线程 程序 设计 细节 ， 对 于 这 一 章 的 最 
好 的 练习 就 是 对 于 同一 个 问题 设计 两 种 不 同 的 解决 方案 ,一 个 使 用 线程 , 另 一 个 使 用 进程 ， 
表 看 一 看 哪 一 个 容易 设计 ,编码 以 及 调试 ; 哪 一 个 运行 的 快 一 些 ; 哪 一 个 又 更 适用 与 兼容 
Unix 的 各 种 版 本 呢 ? 























14.5 线程 间 互 通 消息 


崩 看 一 下 小 面 的 多 线程 字数 统计 程序 。 假 设 你 是 一 个 大 城市 选举 的 负责 人 。 城 市 中 小 
一 点 的 选区 很 快 就 完成 了 统计 票数 的 工作 ,然而 你 却 要 等 到 所 有 的 数字 都 出 来 之 后 才能 家 
布 这 个 重要 的 结果 。 不 过 你 希望 在 每 个 选区 票数 出 来 之 后 立即 可 以 看 到 结果 ， 

在 文件 中 统计 数字 就 像 是 选区 统计 票数 一 样 。 有 些 文 件 比较 大 ,因此 就 需要 较 长 的 时 
问 来 做 统计 。 看 一 看 如 果 下 面 的 命令 被 运行 后 ,结果 是 什么 样 的 ， 


twordcount really- big- file tiny- file 


原 线程 使 用 pthread wait 来 等 候 第 一 个 和 第 二 个 线程 返回 。 在 这 个 例子 当中 ;统计 第 
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一 个 文件 要 比 第 二 个 文件 的 时 间 长 的 多 。 那 么 在 第 二 个 线程 完成 之 后 ,如 何 来 通知 原 线 
程 呢 ? 

一 个 线程 是 如 何 与 另 一 个 线程 互通 消息 的 呢 ? 在 一 个 计数 线程 完成 任务 之 后 , 它 是 如 
何 通知 原 线程 它 的 结果 已 经 产生 了 呢 ? 对 于 进程 来 说 , 当 子 进程 终止 后 ,系统 调用 wait 返 
回 。 是 不 是 对 于 线程 的 处 理 也 有 类 似 的 机 制 呢 ? 某 个 线程 是 否 也 可 以 等 待 其 他 线程 完成 ? 
答案 是 否定 的 。 线 程 无 法 按照 这 种 方法 工作 。 因 为 对 于 线程 而 言 并 没有 父 线程 , 子 线程 的 
概念 ,因此 并 不 存在 某 一 个 明显 的 线程 可 以 去 通知 。 


14. 5.1 通知 选举 中 心 


某 选 区 完成 计 票 后 ,将 其 结果 发 送 给 管理 中 心 看 一 下 下 面 的 这 个 方法 ,此 方法 是 用 来 从 
选区 得 到 选票 ,然后 将 其 发 送 给 管理 中 心 ( 也 许 看 起 来 有 些 古 怪 , 不 过 线程 确实 就 是 用 这 种 
方法 来 与 另外 的 事件 互通 消息 ) 。 

CD 在 选举 中 心 有 一 个 投递 选举 报告 的 邮箱 。 这 个 邮箱 在 某 一 时 刻 只 能 接收 一 份 票数 
报告 。 
此 邮箱 前 有 一 面 旗帜 , 它 可 以 被 升 起 来 ,但 很 快 就 会 被 恢复 至 原 位 。 

(2) 选举 中 心 等 待 这 面 旗帜 升 起 来 。 

(3) 某 选 区 负责 人 将 选区 统计 结果 放 人 邮箱 中 。 

(4) 某 选 区 负责 人 将 邮箱 的 旗帜 升 起 (发 送信 号 ) 。 

(5) 选区 中 心 看 到 旗帜 升 起 来 了 , 便 执行 下 列 步 又 : 

。 从 邮箱 中 取出 选区 的 统计 报告 ; 

。 处 理 此 统计 报告 ; 

© 回 到 原来 的 地 方 继续 等 待 , 即 循环 转 至 步骤 (2) 。 

上 面 的 策略 起 初 看 起 来 有 些 古 怪 , 但 确实 很 有 意义 。 发 送 方 将 数据 存 人 容器 中 , 然 

后 升 起 一 面 旗 帜 来 通知 接收 方 数据 已 经 准备 好 了 。 

图 14. 8 清楚 地 展现 了 选举 中 心 与 两 个 选区 之 间 的 关系 。 每 一 个 选区 将 自己 的 报告 放 人 
邮箱 中 ,然后 通知 选举 中 心 来 取 。 最 后 选举 中 心 处 理 了 报告 。 在 这 个 例子 中 升旗 帜 的 技术 
术语 叫做 发 送信 号 , 即 接 收 方 在 等 待 信号 的 到 来 。 当 然 , 这 里 只 是 个 比喻 ,对 旗帜 的 操作 与 
Unix 里 的 信号 量 机 制 一 点 关系 也 没有 ,两 者 仅仅 是 基本 思路 相同 而 已 。 


LR 





选举 中 心 选区 1 选区 2 
图 14.8 使 用 加 锁 的 邮箱 来 传递 数据 
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从 图 14. 8 中 还 可 以 看 到 另外 一 样 东 西 : 邮箱 上 有 一 把 锁 。 邮 箱 仅 仅 可 以 容 钠 一 份 报 
告 ,因此 在 某 个 时 刻 只 能 有 一 人 拥有 对 邮箱 访问 的 权限 。 虽然 锁 的 加 入 使 邮箱 结构 看 起 来 
有 些 复 条 ,但 却 使 得 邮箱 相当 可 靠 。 使 用 锁 机 人 制 的 邮箱 系统 ,其 完整 的 过 程 如 下 。 

C1) 选举 中 心 建 一 个 投递 选举 报告 的 邮箱 。 

此 邮箱 在 某 个 时 刻 只 能 容纳 一 份 选 举报 告 。 

此 邮箱 旁 有 一 面 旗帜 , 它 可 以 被 升 起 来 ,但 很 快 就 会 被 恢复 至 原 位 。 

此 邮箱 有 一 把 下 斤 的 锁 , 可 以 被 锁 住 或 打开 。 

(2) 选举 中 心 将 邮箱 锁 打 开 , 然 后 等 待 旗帜 信号 的 到 来 。 

基 选 区 负 页 人 等 在 邮箱 口 ,直到 它 可 以 将 邮箱 锁 住 。 

如 果 邮 箱 非 空 ,选区 负责 人 先 将 邮 逢 锁 打 并, 等 待 着 旋 帆 信号 的 到 来 ,然后 再 将 邮箱 
锁 住 。 

选区 负责 人 将 选举 报告 放 人 邮 籍 中 。 

(3) 选区 人 负责 人 将 旗帜 升 起 ,把 信和 号 发 出 去 。 

选区 负责 人 把 邮箱 上 的 锁 打 并 。 

(4) 选举 中 心 看 到 旗帜 信和 号 ,停止 等 待 。 

选举 中 心 镇 住 邮箱 。 

选举 中 心 将 选举 报告 拿 出 。 

选举 中 心 处 理 该 选举 报告 。 

选举 中 心 开 起 旗帜 ,以 防 某 一 选区 负责 人 已 经 等 待 了 很 久 。 

选举 中 心 转向 步骤 (2)。 


14.5.2 使 用 条 件 变量 编写 程序 


下 面 将 计算 投票 数目 的 系统 转换 成 字数 统计 的 程序 。 计 票 系统 使 用 了 .种 设备 ; 容器 、 

旅 帜 和 锁 。 这 三 种 不 同 的 设备 对 应 了 线程 编程 中 的 三 项 ; 一 个 变量 保存 数据 .一 个 条 件 
对 象 和 一 个 互 斥 量 。 图 14. 9 展示 了 三 个 线程 和 三 个 变量 。 一 个 变量 用 作 指 向 字数 计数 器 的 
指针 ,一 个 变量 用 作 条 件 对 象 ,而 另 一 个 变量 用 作 互 斥 量 。 

研究 一 下 程序 的 内 在 逻辑 。 原 线程 启动 了 两 个 计数 线程 然后 开始 等 竺 结果 的 到 米 。 特 
基地 ,上 康 线 程 调 用 pthread cond wait 函数 来 等 待 “ 旗 帜 升 起 "。 这 个 系统 调用 将 原 线程 

当 某 一 计数 线程 完成 计数 后 ,此 线程 通过 把 指针 存 入 "邮箱 ”变量 的 方法 来 传递 结果 。 
首先 ,此 线程 对 此 邮箱 加 锁 ; 然 后 线程 恰 查 邮箱 ;如 果 上 邮箱 非 空 ;线程 把 邮箱 锁 打 天 并 等 待 着 
信号 的 到 来 ;之 后 ,线程 肯 一 次 把 邮箱 锁 住 ,并 把 结果 放 入 邮箱 ;最 后 ,计数 线程 调用 了 函数 
pthread_cond_signal, 将 条 件 变量 flag ix mM BE DR" AK 

此 时 由 于 执行 pthread_cond_wait 而 挂 起 等 待 条 件 变量 flag 变化 的 原 线程 被 计数 线程 
发 出 去 的 信和 号 唤醒 了 。 原 线程 急切 地 想 冲 过 去 打 半 邮箱, 然 击 此 时 的 邮箱 仍然 被 计数 线程 
锁 在 那里 。 

当 计 数 线程 通过 调用 pthread_mutex_unlock 把 邮箱 锁 打 并 之 后 , 原 线程 终于 得 到 了 对 
这 把 锁 的 控制 权 。 康 线程 将 选举 报告 从 邮箱 中 拿 出 来 ,在 屏幕 上 显示 出 来 ,再 将 其 加 到 总 数 
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UL M———————————————————————— 


存储 数据 的 变量 
通知 读者 的 信号 





14.9 用 加 锁 的 变量 机 制 来 传递 数据 


中 去 。 然 后 原 线程 发 出 信号 ,以 防 别 的 计数 线程 正在 等 待 。 最 后 原 线程 循环 回去 ,继续 调用 
pthread cond wait 函数 ,自动 将 互 斥 量 解锁 ,并 将 自己 挂 起 直到 下 一 次 的 信号 到 来 。 

上 面 一 段 所 讨论 的 步 又 恰好 对 应 于 投票 系统 的 原型 ,也 同样 对 应 于 下 面 将 看 到 的 
twordcount4. c 中 的 代码 : 


/* twordcount4.c 一 threaded word counter for two files. 
* — Version 4; condition variable allows counter 
* functions to report results early 


* 


# include 一 stdio. h> 
# include — pthread. h> 
# include —ctype. h> 


struct arg set | /* two values in one arg */ 
char * fname; /* file to examine */ 
int count; /* number of words */ 


和 

struct arg set * mailbox; 

pthread mutex t lock - PTHREAD MUTEX INITIALIZER; 
pthread cond t flag - PTHREAD COND INITIALIZER; 


main(int ac, char * av[ ]) 


{ 


pthread t tl, t2; /* two threads */ 
struct arg set argsl, args2; /* two argsets */ 
void * count words(void * ); 


int reports in - 0; 
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} 


int total_words = 0; 


if Cac!= 301 
printf("usage; $a filet file2\n", avit [0]; 
exit(1)5; 
} 
pthread mutex lock(&lock); /* lock the report box now x/ 


argsl.fname - av[1]; 


Q- 


argsl.count 


pthread create(&tl, NULL, count words, (void * ) &args1); 


args2.fname = av[2]- 
argsZ.count = 0; 


F 


pthread create(&t2, NULL, count words, (void x) &args2); 


while( reports in « 2 ){ 
printf( "MAIN, waiting for flag to go up\n"); 
pthread cond wait(&flag, &lock); /* wait for notify x/ 
printf("MAIN. Wow! flag was raised, I have the lock\n"); 
printf(" € 7d, *sVin", mailbox- count, mailbox- > fname); 
total words += mailbox- count; 
if ( mailbox == &argsi) 
pthread_join(t1,NULL); 
if ( mailbox == &args2) 
pthread join(t2,NULL); 
mailbox = NULL; 
pthread cond signal(&flag); 
reports in-**; 
! 
printf(" $ 7d; total words\n", total words); 


void x count words(void ¥ a) 


{ 


struct arg set * args = a; /* cast arg back to correct type */ 
FILE * fp: 
int c, preve = '"AD'. 


if( (fp = fopen(args ~ 7-fname, "r"))!- NULL }{ 
while( ( c = gete(fp))!- EOF }{ 
if C T isalnum(c) && isalnum(prevc) ) 
args 一 —counttt. 


prevc = c; 
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fclose(fp); 

j else 
perror(args — fname), 

printf("COUNT. waiting to get lock\n"); 
pthread mutex lock(&lock); /* get the mailbox */ 
printf("COUNT; have lock, storing data\n") ; 
if ¢ mailbox!s NULL) 

pthread _cond_wait(&flag,&lock) - 
mailbox = args; /* put ptr to our args there «/ 


printf("COUNT. raising flag\n"}; 


pthread cond signal(&flag); /* raise the flag */ 
printf( "COUNT, unlocking boxXn"); 

pthread mutex unlock(&lock); /* release the mailbox x/ 
return NULL; 


FAREI io T A AR EH 


$ cc twordcount4.c ~ lpthread -a twc4 

$ .f/twc4 /etc/group /usr/dict/words 

COUNT, waiting to get lock 

MAIN, waiting for flag to go up 

COUNT; have lock, storing data 

COUNT, raising flag 

COUNT: uniocking box 

MAIN, Wow! Flag was raised, I have the lock 
195. /ete/group 

MAIN; waiting for flag to go up 

COUNT; waiting to get lock 

COUNT, have lock, storing data 

COUNT; raising flag 

COUNT, unlocking box 

MAIN; Wow! fiag was raised, I have the lock 
45419, /usr/dict/words 

45614, total words 


14.5.3 使 用 条 件 变量 的 函数 


在 邮箱 上 用 来 通知 其 他 线程 的 旗帜 就 是 一 个 条 件 变量 。 下 面 函 数 的 作用 就 是 使 用 条 件 
变量 进行 通信 。 
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pthread cond wait 
































目标 使 线程 挂 起 ,等 待 某 条 件 变量 的 信号 。 
Xx # include << pthread, h> 
ER fS In 3H int pthread. cond, wait (pthread, cond, t: * cond, 
pihread mutex t * mutex); 

参数 cond 指向 其 条 件 变量 的 指针 

mutex 指向 互 斥 锁 对 象 的 指针 
返回 值 0 RIE 8l 

errcode 错误 





pthread cond wait 使 线程 挂 起 直到 另 一 个 线程 通过 条 件 变 量 发 出 消息 。pthread_cond 
_wait 画 数 总 是 和 互 斤 锁 在 一 起 使 用 。 此 函数 先 自动 释放 指定 的 锁 , 然 后 等 待 条 件 变 基 的 变 
化 。 如 果 在 调用 此 肾 数 之 前 ,万 斥 量 mutex 并 没有 被 锁 住 ,函数 执行 的 结果 是 不 确定 的 ， 在 
返回 原 调 用 函数 之 前 ,此 画 数 白 动 将 指定 的 开矿 量 重 新 锁 住 。 


pthread cond signal 




















目标 ie BE TF TE EA hA A E 
ah # include <= pthread, h> 
函数 原型 int pthread, cond signal(pthread. cond, t * cond) ; 
ET. cond 指向 某 条 件 变量 的 指针 。 
iE E fk o 成 功 返 回 
errcode 错误 








pthread cond signal 晒 数 通过 条 件 变量 cond 发 消息 。 若 没有 线程 等 候 消息, 什么 部 不 
会 发 生 ; 若 是 名 个 线程 都 在 等 竺 ,只 唤醒 它们 中 的 一 个 。 


14.5.4 回 到 Web 服务 器 例子 


通过 前 面 的 学 习 , 大 家 已 经 了 解 了 POSIX 线程 系统 最 基本 知识 和 技 后 ,包括 如 何 创建 新 
的 线程 .如 何等 候 线 程 返回 .如 何 安全 地 在 线程 间 共 享 数 据 以 及 线程 如 何 与 其 他 线程 互通 消 
B. 相依 大 家 已 经 有 中 句 多 的 知识 可 以 完成 Web 服务 器 与 复杂 动画 的 制作 


14.6 多 线程 的 Web 服务 器 


前 面 的 章节 已 经 写 了 一 个 Web 服务 器 的 程序 。 服 务 器 使 用 fork 系统 调用 创建 新 的 进 
程 来 处 理 客 户 端 的 请 求 。Web 服务 器 需要 元 成 三 种 操作 :将 目录 列表 返回 ;将 文件 内 容 返 
加 ;以 及 将 CGI 程序 的 输出 返回 。 

服务 器 需要 新 的 进程 来 运行 CGI 程序 ,但 是 并 不 需要 新 的 进程 来 读 取 月 录 列 表 和 文件 
A. . 
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14.6.1 Web 服务 器 程序 的 改进 


这 里 对 前 一 个 版 本 的 Web 服务 器 程序 作 了 很 多 修改 。 最 重要 的 是 使 用 函数 pthread_ 
create 替换 了 fork。 在 新 的 版 本 中 客户 端的 请 求 不 再 由 单独 的 进程 来 处 理 , 而 是 由 同一 进程 
的 多 个 线程 来 处 理 。 

巡 外 还 做 了 两 个 改动 :首先 , 移 除 了 CGI 的 功能 。 后面 的 章节 会 把 这 个 功能 加 上 去 。 其 
次 ,自己 写 了 一 个 对 是 洪 进 行列 表 的 函数 ,而 以 前 的 版 本 是 通过 调用 exec 执行 标准 1s 命令 来 
完成 对 目录 的 列表 的 。 


14.6.2 在 多 线程 的 版 本 允许 一 个 新 的 功能 


多 线程 的 特性 允许 我 们 洪 如 一 个 新 的 功能 :内 部 统计 。 服 务 器 的 运行 者 通常 希望 知道 
服务 器 的 运行 时 间 .接收 的 客户 端 请 求 的 数 日 以 及 发 送 回 窜 户 端 的 数据 量 。 

因为 对 于 所 有 的 请 求 共 享 内存 空间 ,可 以 使 用 共享 变量 的 方式 来 进行 统计 。 那 么 用 户 
如 何 访问 这 些 统计 数据 呢 ? 这 里 如 入 一 个 特殊 的 URL: status。 当 远程 用 户 请 求 此 URL 
时 ,服务 器 将 内 部 的 统计 数据 发 给 客户 端 。 


14.6.3 WIEP iE (Zombie Threads) :独立 线程 


现在 来 考虑 另 一 个 技术 细节 。 木 章 中 所 提 到 所 有 的 程序 中 都 使 用 了 pthread_join MR 
来 等 待 线程 返回 。 每 个 线程 都 占用 了 系统 资源 。 如 果 程 序 员 忘记 使 用 pthread_join 来 收回 
线程 ,这 些 被 线程 所 占用 的 资源 就 无 法 被 回收 ,类 似 于 用 malloc 米 分 配 的 空间 地 没有 用 free 
释放 掉 -- 样 。 

在 字数 统计 的 程序 中 , 原 线 程 不 得 不 等 待 所 有 的 计数 线程 返回 之 后 , 才 可 以 收集 数据 。 
然而 Web 服务 器 却 没有 理由 等 待 处 理 请 求 的 线程 返回 。 因 为 原 线 程 不 需要 从 这 些 线程 得 到 
任何 返回 数据 ， 

这 里 同样 可 以 创建 不 需要 返回 的 线程 , 称 之 为 独立 线程 (Detached Threads) 。 当 函数 执 
行 完毕 之 后 ,独立 线程 自动 释放 它 所 占用 的 所 有 的 资源 ,它们 自身 甚至 也 不 允许 等 待 其 他 的 
线程 返回 。 可 以 通过 传递 一 个 特殊 的 属性 参数 始 函 数 pthread_crcate 来 创建 一 个 独立 线程 。 

















/* creating a detached thread x, 

pthread t t; 

pthread attr t attr detached; 

pthread attr init(&attr detached); 

pthread attr setdetached(&attr detached,PTHREAD CREATE DETACHED); 
pthread create(&t,&attr detached, func,arg); 


14.6.4 Web 服务 器 代码 
采用 多 线程 方法 实现 Web 服务 器 的 完整 代 二 如 下 ， 





/* twebserv.c 一 a threaded minimal web server (version 0.2) 














* 446 。 


Unix/Linux fg fe 3r pe 2x Ri 








* usage; tws portnumber 


* features; supports the GET command only 


x 


* 


* 


runs in the current directory 
creates a thread to handle each request 


Supports a special status URL to report internal state 


* building, cc twebserv.c socklib.c - lpthread - o twebserv 


af 


# include < stdio. h> 


# include «sys/types, h> 


# include <isys/stat. h= 


f include — string. h> 


# include < pthread. h> 
# include < stdlib. h> 
# include «Cunistd. h> 


# include «dirent. h= 
# include < time. h> 


/* server facts here < 


time t 


int 


int 


server Started ; 
server bytes sent; 


server requests: 


main(int ac, char x av[ ' 


1 


int SOCk, fd; 
int * fdptr; 


pthread t worker; 
pthread at&ttt; 


void x handle call(void *2; 


if (ac ==13{ 


} 


fprintf(stderr, “usage, tws portnum\n") ; 
exit(1). 


sock = make server socket( atoi(av|1]) ); 


if ( sock == - 1) ( perrorí "making socket"); exit(2); } 


setup(&attr); 


/* main loop bere, take call, handle call in new thread af 


while(1){ 


fd = accept( sock, NULL, NULL); 


server requests ++ - 














第 14 章 RENH: 并 发 函数 的 使 用 


447 





} 


fe 


fdptr = mallec(sizeof(int)); 
* fdptr = fd; 
pthread create(&worker,&attr,handle call,fdptr); 


* initialize the status variables and 


* set the thread attribute to detached 


af 


setup(pthread attr t * attrp) 


1 


} 


pthread attr init(attrp); 
pthread attr setdetachstate(attrp,PTHREAD CREATE DETACHED) ; 


time(&server started); 
Server requests = Ü; 


server bytes sent = Ü; 


void * handle callívoid * fdptr) 


{ 


/x* 


FILE  x*fpin; 
char request[BUFSIZ]; 
int fd H 


fd = # (int x» }fdptr; 
free(fdptr); /* get fd from arg «/ 


fpin = fdopen(fd, "r"). /* buffer input #/ 
fgets(request,BUFSIZ,fpim; /* read client request */ 
printf("got a call on $ d; request = $s", fd, request}; 


Skip rest of header(fpin); 
process rq(request, fd); /* process client rq «/ 


fclose(fpin); 


skip rest of header(FILE +} 
Skip over all request info until a CRNL is seen 





skip rest of header(FILE » fp) 


{ 


charbof[BUFSIZi-[|, 
while( fgets(buf,BUFSIZ,fp) |= NULL && stremp(buf, "ArXn, "™) 
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yo ——-----2--2- 
process rg( char * rq, int fd } 
do what the request asks for and write reply to fd 
handles request in a new process 
rq is HTTP command; GET /foo/bar.html HTTP/1.0 





process rq( char * rq, int fd) 


{ 


} 


char emd[BUFSIZ}, arg| BUFSIZ]; 


一 


if ( sscanf(rq, ,"%s%s,", cmd, arg) [= Z) 
return; 
sanitize(arg); 


printf{ "sanitized version is * s\n", arg); 


if ( stremptemd, "GET") |= 0) 
not implemented(); 

else if ( built in(arg, fd) ) 

else if ( not exist( arg > ) 
do 404(arg, fd); 

else if ( isadir( arg ? } 
do ls( arg, fd}; 

else 


do cat( arg, fd}; 


fx 


* make sure all paths are below the current directory 


x/ 


sanitize(char x str) 


1 


char * src, + dest; 
src = dest = str; 


while( # src }{ 


if ( strnemp(sre,"/../",4) --0) 


sre += 3; 
else if ( strnemp(sre,"//",2) --0) 
sret+t ; 


else 
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xdesttt = ssrctt; 
t 
* dest = ,'\0,'; 
if ( *str == '/!) 


strepy(str,str+ 1}; 


if ( str[0; 27 'NO' [| stremp(str,". /")-=0 
|| stremp(str,"./.."} 20) 
strcpy(str,"."):; 


/* handle built ~ in URLs here. Only one so far is "status" #/ 
built in(char «arg, int fd) 
i 
FILE + fp; 
if ( stremp(arg, "status") 1= 0} 
return Ü; 


http reply(fd, &fp, 200, "UK", "text/plain", NULL); 


fprintf(fp,"Server started; $& s", rtime(&server started)); 
fprintf(fp, "Total requests: & dn", server requests); 
fprintf fp, "Bytes sent out, 8$ dXn", server bytes sent); 
fclose(fp); 


return 1; 


http reply(int fd, FILE x * fpp, int code, char * msg, char + type, char x content) 


1 
FILE *fp = fdopen(fd, "w"); 
int bytes - 0; 


if Cfp s NULL | 


bytes = fprintf(fp,"HTTP/1.0 $d *sirAn", code, msg); 


F 


bytes += fprintf(fp,"Content- type; & s\r\n\r\n", type); 


if € content ) 


bytes += fprintf(fp," & s\r\n", content); 
} 
tflush(fpo; 
if ( fpp) 
*fpp = fp; 
else 
fclose(fp): 


return bytes; 
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simple functions first, 
not implemented(fd) ^ unimplemented HTTP command 
and do 404(item,fd) no such object 


not_implemented( int fd) 


{ 
http_reply(fd, NULL, 501, "Not Implemented", "Lext/plain" 


"That command is not implemented"); 


do 404(char * item, int fd) 
i 
http replyCfd, NULL, 404, "Not Found", "text/plain", 
"The item you seek is not here"); 





the directory listind section 


isadir() uses stat, not exist() uses stat 





isadir(char x f) 
{ 
struct stat info; 


return ( stat(f, &info) {= 一 1 && S ISDIR(info.st mode) ); 


not exist(char x f) 


struct stat info; 


return( stat(f,&infg) == -1); 


do ls(char x dir, int fd) 


了 
H 


DIR * dirptr; 

struct dirent x direntp; 
FILE * fp; 

int bytes = 0; 


bytes = http reply(fd,&fp,200, "OR", "text/plain" NULE); 
bytes += fprintf(tp, “Listing of Directory % s\n", dir); 


if ( (dirptr = opendir(dir)) f= NULL)! 
while( direntp = readdir(dirptr) 5! 
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bytes += fprintf(fp, "'&sin", direntp- —d name); 
} 
closedir(dirptr); 
} 
fclaset(fp); 
server byLes sent += bytes; 


} 





fy 一 -~ ee eee. 


D 





functions to cat files here. 


file typstfilename) returns the 'extension'; cat uses it 





char * file type(char » f) 
1 
char * cp; 
if ( (cp = strrchr(f,'.' )) 1= NULL) 
return ep * 1; 


return" -'5 


d 
/* do cat(fileneme, fd); sends header then the contents */ 


do cat(char xf, int fd) 
1 


char x extension = file type(f); 
char * type = "text/plain "; 
FILE + fpsock, * fpfile; 


inte; 
intbytes = 0; 
if ( stremp(extension, "html ") ==0 ) 


type = "text/html". 

else if ( stromp(extension, "qif") ==0 } 
type = "image/gif"; 

else if ( strcmp(extension, "jpg") ==0) 
type = "image/jpeg"; 

else if ( stromp(extension, "Jpeg") == ) 
type 7 "image/jpeg"; 

fpsock = fdopen(fd, "w"); 

fpfile = fopen( f , "r"); 

if ( fpsock |= NULL && fpfile !- NULL} 

f 
bytes = http reply(fd,&fpsock,200, "OK", type, NULL) ; 
while( (c = getc(fpfile) ) t= EOF | 
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putc(c, fpsock); 
bytes ++; 
t 
fclose(fpfile); 
fclosetfpsock) ; 


} 
server bytes sent += bytes; 


) 


此 程序 虽然 能 够 正常 工作 ,但 还 是 有 一 个 问题 ;统计 的 功能 使 用 共享 变量 机 制 ,但 共享 
的 变量 并 未 被 互 斥 锁 所 保护 。 加 入 互 尺 锁 的 功能 就 留 给 大 家 作为 练习 。 


14.7 线程 和 动画 


Web 服务 器 程序 不 需要 线程 也 可 以 工作 ,因为 可 以 使 用 fork 来 处 理 并 发 的 请 求 。 然 而 
如 果 没 有 引 人 线 程 机 制 ,Web 浏览 器 却 无 法 轻易 地 使 画面 和 广告 动 起 来 。 对 线程 的 下 一 个 
应 用 是 如 何 用 多 线程 来 控制 动画 。 

在 视频 游戏 那 一 章 中 ,使 用 了 定时 器 来 控制 动画 。 定 时 器 以 一 个 特定 的 时 间 间 隔 来 发 
送 SIGALRM 消息 ,信和 号 处 理 者 使 用 计数 器 来 决定 何 时 移动 图 片 。 


14.7.1 使 用 线程 的 优点 


信和 号 处 理 者 和 定时 器 的 机 制 虽然 可 以 完成 上 作 ,但 线程 机 制 更 好 地 匹配 了 肉 部 和 外 部 的 结 
构 。 在 外 部 ,用 户 可 以 看 多 两 个 独立 的 活动 流程 :动画 和 键盘 控制 ,如 图 14. 10 所 示 ， 
动画 线程 会 用 到 关于 
ATK ILE 


p 


PANNI 
i Zirecticn["  ] 
j = T 





wm, SHR EKER 
i eame 


图 14. 10 动画 图 片 太 其 键盘 控制 





在 内 部 ,线程 可 以 将 控制 动画 代码 和 键盘 输入 代码 分 并。 如 图 14. 11 所 示 ,线程 间 通 过 
共享 变量 方式 定义 位 置 .动画 速度 

当然 ,画面 的 移动 还 是 通过 隐藏 的 定时 器 来 完成 的 ,但 多 线程 的 解决 方案 让 我 们 更 关注 
于 程序 的 组 织 结构 。 

多 线程 与 原先 的 方法 相 比 还 有 另外 :个 好 处 。 现 代 的 线程 库 允 许 不 同 的 线程 运行 在 不 
网 的 处 理 器 蕊 片上 ,从 而 实现 了 真正 意义 上 的 并 行 。 对 于 动画 而 言 , 其 轨道 .旋转 以 及 纹理 
的 绘制 都 需要 复杂 的 计算 ,因此 在 多 个 处 理 器 上 运行 线程 可 以 提供 更 快 的 处 理 速 度 和 更 如 
LUE AY E T- 


第 14 章 RENH: 并 发 函数 的 使 用 e 453 * 





键盘 线程 动画 线程 
图 14.11 动画 线程 及 键盘 线程 


14.7.2 多 线程 版 本 的 bounceld.c 
比较 一 下 原先 版 本 bounceld. c 与 新 的 两 线程 版 本 tbounceld. c 的 区 别 : 


/* h tbounceld.c: controlled animation using two threads 


* note one thread handles animation 

* other thread handles keyboard input 

* compile cc tbounceld.c - lcurses - lpthread - o tbounceld 
x/ 


# include <stdio. h> 
# include <‘curses. h> 
# include < pthread. h> 
# include 一 stdlib. h> 
# include <unistd. h> 


/* shared variables both threads use. These need a mutex. x/ 


# define MESSAGE " hello" 


int row; /* current row */ 
int col; /* current column */ 
int dir; /* where we are going */ 
int delay; /* delay between moves x/ 
main() 
{ 
int ndelay; /* new delay */ 
int c; /* user input «/ 
pthread t msg thread; /* a thread x/ 


void * moving msg(); 


initscr(); /* init curses and tty «/ 
crmode(); 
noecho() ; 
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clear(; 

row = 10; /* start here «/ 

col = 0; 

dir = 1; /* add 1 to row number */ 
delay = 200; f/x 200ms = 0.2 seconds +/ 


if ( pthread create(&msg thread, NULL,moving msg, MESSAGE) }{ 
fprintf(stderr, "error creating thread"); 
endwin(); 
exit(0); 

} 


while(1) ( 
ndelay = 0; 
c = getch(); 
if (c == 'Q'J break; 
ifte == ' '3dir = -dir; 
if(o == 'f'&&delay > 2) ndelay = delay/2; 
if( c == 's') ndelay = delay * 2 ; 
if ( ndelay > 0 ) 
delay = ndelay ; 
} 
pthread cancel(msg thread); 
endwin(), 


} 


void * moving msgí(char # msg) 


1 


while( 15 { 
usleep(delay x 1000); /* sleep a while «/ 
move( row, col; . /* set cursor position x/ 
addstr( msg 5; /* redo message «/ 
refresh(); /* and show it */ 


/* move to next column and check for bouncing x/ 


col += dir; /* move to new column #/ 
ift cal < = 0 && dir == -1) 

dir = 1; 
else if ( col + strlen(msg) 7» = COLS && dir == 1) 

dir = -1; 


} 


新 版 本 的 动画 程序 与 老 版 本 的 单线 程 程序 有 何 区 草 昵 ? 最 大 的 不 同 之 处 在 于 main BR 
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数 中 创建 了 一 个 新 的 线程 来 执行 moving_msg A. moving msg 函数 执行 了 一 个 简单 的 循 
环 :sleep,move, 检 查 跳 路 ,repeat。 同 时 ,在 同一 个 进程 的 男 一 部 分 ,main 函数 也 执行 一 个 简 
单 的 循环 ;getch, 人 处理 ,repeat。 

修改 后 的 程序 仍然 用 全 局 变量 表示 球 的 状态 。 在 基于 中 断 的 版 本 中 ,必须 使 用 全 局 变 
量 , 因 为 无 法 将 参数 传 给 信号 处 理 者 。 然 而 线程 机 制 却 允许 线程 接收 参数 ,因此 可 以 像 上 面 
字数 统计 程序 的 第 三 ,第 四 版 本 一 样 ,通过 创建 结构 体 , 并 将 其 地 址 传 给 线程 的 方式 来 改进 
程序 。 


14.7.3 基于 多 线程 机 制 的 多 重 动画 : tanimate. c 


怎样 才 可 以 同时 使 多 条 消息 活动 起 来 呢 ? 多 线程 的 字数 统计 程序 并 发 地 运行 了 多 个 字 
数 统计 函数 的 实例 ,每 一 个 调用 都 传递 给 此 函数 一 个 文件 名 和 一 个 独立 的 计数 器 。 用 同样 
的 道理 可 以 运行 并 行 的 动画 。 

下 面 的 多 线程 动画 程序 tanimate. c 是 tbouncel. c 的 一 个 扩展 。tanimate. c 最 多 可 以 接 
受 10 个 命令 行 的 参数 ,使 每 一 个 参数 在 不 同 的 行 上 移动 ,并 且 有 自己 独立 的 速度 和 方向 。 例 
如 ,下 面 的 命令 


tanimate 'Buy this' 'Drive this car' 'Spend Money here' Consume '1Buy! ' 


将 产生 一 个 包含 多 种 跳动 的 动画 消息 ,如 图 14.12 BER. 









Buy this! 
Drive this car! 
Spend money here! 






Consume! 







Buy! 





'Q' to quit, '0'..'4' to bounce 


图 14.12 多 种 跳动 的 动画 消息 


用 户 可 以 通过 按键 “0”“1” 等 使 处 在 该 行 上 的 消息 跳动 。 

也 可 以 使 一 组 字符 串 活动 起 来 ,甚至 是 那些 Unix 的 工具 ,可 以 尝试 下 面 的 命令 : 
tanimate 'ls' 

tanimate ^ 'users' 

tanimate 'date' 


tanimate 在 不 同 的 线程 中 运行 控制 动画 的 函数 。 这 个 函数 的 每 一 个 实例 都 接收 到 原始 
线程 所 传 的 一 组 不 同 的 参数 。 参 数 指定 了 消息 名 称 , 行 号 ,移动 方向 以 及 速度 : 


/* tanimate.c; animate several strings using threads, curses, 


* usleep() 











456 。 Unix/Linux 编程 实践 教程 





* bigidea one thread for each animated string 

* one thread for keyboard control 

= shared variables for communication 

* compile ec tanimate.c - leurses — lpthread - o tanimate 
* tà do needs locks for shared variables 

* nice to put screen handiing in its own thread 


af 


# include < stdio. h> 

# include «curses. h 

# include «pthread. h> 
# include <stdlib.h> 

# include — unistd. h 


# define MAXMSG 10 /* limit to number of strings x/ 


# define TUNIT 20000 /* timeunits in microseconds */ 


struct propset { 


char * str; /* the message #/ 

int row; /* the row «/ 

int delay; /* delay in time units */ 
int dir; j+ tlor -1*sf/ 


5. 


pthread mutex t mx = PTHREAD MUTEX INITIALIZER; 


int maintint ac, char # av| |) 
{ 


int e; /* user input &/ 

pthread t thrds[ AXMSC | : /* the threads x/ 

struct propset — props[ AXMSG]; /* properties of string */ 
void * animate(); /* the function */ 

int num msg ; /* number of strings */ 
int i; 


r 


if (ac == 194 
printf("usage, tanimate string ..\n"); 
exit(1)}; 


num msg = setup(ac- l,av t l,props); 


/* create all the threads */ 
for (i=0 ; inum msg; i++} 
if ( pthread creste(&thrds[i!, NULL, animate, &props[i]))! 
fprintf(stderr, "error creating thread"); 


endwin(): 
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了 





exittüJ; 


} 


/* process user input */ 


whileti | 
c = getch(); 
if {c == 'O') break; 
itffe== ' 7) 


for (i= 0;i<num_msg;i++ } 
props[|i].dir = - props[ i].dir; 
if (c > = 'üU'&&ox-'98'! i 
io 
if ( i « num msg) 


props[iJ.dir = - props[i!.dir; 


/* cancel all the threads +/ 
pthread mutex lock(&mx); 
for (i= 0; 


pthread cancel(&hrds[ i]; 


ise mam mad; it ) 


endwint); 
return Ü; 


j 


int setup(int nstrings, char x strings[ |, struct propset propsl i) 


1 


int num msg = ( nstrings “> MAXMSG ? MAXMSG : nstrings ); 


int i; 


/* assign rows and velocities to each string x/ 


Srand(getpid()),; 

for (i=0; i<inum msg: i++); 
props[i].str = strings[il; /* the message */ 
props[i].row = i; /* the row «/ 
props|i].delay = 1+ (rand() €15); /* a speed «/ 
props[i].dir = ((rand() &2)? 1, - 12; fx tlor -1le/ 


) 


/* set up curses #/ 

initscr(); 

crmode() ; 

noecho() ; 

clear(); 

mvprintw (LINES —1,0,"'0' to quit, '0'.. ' &d' to bounce", 


num msg 1); 
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return num msg; 


} 


/* the code that runs in each thread */ 
void x animate(void * arg) 


r 


à 


struct propset x info = arg; /* point to info block */ 
int len = strlen(info- —str) *2; i+ +2 for padding «/ 

int col = rand¢} $ (COLS - len - 3}; /* space for padding */ 
while( 1 ) 


{ 


usleep(info - “delay + TUNIT) ; 


pthread mutex lock(&mx); /* only one thread x/ 
novel info- ~>row, col); /* can call curses x/ 
addch(' '); | /* at the same time x/ 
addstr( info- “str ); /x Since I doubt it is «/ 
addch(' '); /* reentrant */ 
movet LINES - 1,COLS -- 1); /* park cursor */ 
refresh(); /* and show it #/ 

pthread mutex unlock(&mx); {+ donewith curses */ 


/* move item to next column and check for bouncing x^ 


col + = info- dir; 


if (col = 0 && info- dir == -1 ł} 
info- dir = 1; 
else if {col + len => = COLS && info- dir == 1) 
info- dir = -1i; 


14.7.4 tanimate, c 中 的 互 斥 量 


上 面 的 程序 ,整个 代码 分 为 三 段 :初始 化 .控制 移动 消息 的 函数 和 一 个 读 取 和 处 理 用 户 
输入 的 循环 。 用户 输 入 循环 在 初始 线程 中 运行 ,而 控制 动画 的 函数 却 是 运行 在 好 几 个 线程 
中 。tanimate 可 以 最 多 同时 有 11 个 线程 在 运行 。 在 线程 并 行 运 行 过 程 中 ,共享 资源 是 什么 ? 
取 如 何 业 防止 线程 间 的 共 京 冲突 呢 ? 

L 数据 冲突 : 互 斥 量 的 动态 初始 化 

控制 动画 的 函数 可 以 使 用 或 修改 作为 参数 传递 给 它 的 结构 体 成 员 的 值 , 它 们 包括 位 置 、 
速度 以 及 运动 方向 。 当 用 广 使 一 条 消息 跳动 之 后 ;输入 线程 修改 了 结构 体 中 成 员 dir 的 值 ， 
大 家 都 知道 ,共享 变量 需要 互 斥 量 来 防止 数据 的 冲突 。 那 么 是 查 需 要 为 所 有 的 方向 变量 ( 即 
结构 体 中 的 成 员 dir 增加 一 个 互 斥 量 呢 ? 
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一 个 比较 好 的 方案 是 在 每 一 个 结构 体 中 建 一 个 互 斥 量 。 当 控制 动画 的 线程 和 用 户 输入 
线程 读 取 或 修改 结构 体 中 共享 变量 的 时 候 ,这 个 互 斥 量 开始 工作 。 修 改 后 的 结构 体 定 义 
WP: 





struct propset{ 


char * str; /* the message «/ 
int row; /* the row x/ 
int delay; /* delay in time units x/ 
int dir; /* *l1or-1s/ 
pthread mutex t lock; /* a mutex for dira / 
} 
setup 中 的 初始 化 程序 如 下 : 
for(i-0, i-num msg; i++ 71 
props[i].str = strings[1^; /* the message x/ 
props[i].row = i; /* the row x/ 
props[i].delay = 1+ (rand() %15); /* a speed «/ 


props[i].dir = ((rand() %2)? 1,— 10;  /« +lor-1lx/ 
pthread mutex init(&props[ i]. lock, NULL); 
} 


程序 中 其 他 的 改进 留 给 大 家 作为 练习 。 

2. 屏幕 冲突 :临界 区 

方 册 变量 并 不 是 惟一 的 共享 资源 。 修 改 屏幕 和 光标 位 置 的 各 函数 同样 也 被 所 有 动画 线 
程 共 掌 。 可 使 用 互 斥 量 mx 来 防止 对 这 些 函 数 的 同步 访问 冲突 。 

看 一 下 animate 中 的 屏幕 控制 调用 ;move、addch、addstr 和 refresh。 如 果 两 个 线程 并 发 
地 按照 这 个 顺序 执行 指令 ,那么 结果 会 怎样 9 举例 来 说 ,如 果 两 个 线程 交替 地 调用 :move、 
move,addch .addch addstr、addstr… ,会 导致 什 么 样 的 结果 ? 

第 一 个 线程 使 用 move 将 光标 置 于 某 个 屏幕 位 置 ,然后 第 二 个 线程 又 会 将 其 称 到 别 的 地 
方 去 。 然 而 这 时 第 一 个 线程 以 为 光标 述 在 床 处 ,就 将 一 些 文字 输出 到 这 个 位 置 ,结果 显然 是 
错误 的 ! 

由 于 设置 光标 的 库 函 数 不 会 意识 到 线程 的 存在 ,所 以 对 某 个 特定 函数 的 访问 并 不 会 因 
为 多 线 程 的 存在 而 受 干扰 。 但 为 了 保证 某 一 时 刻 只 有 一 个 线程 可 以 访问 设置 光标 的 函数 ， 
这 里 同样 使 用 了 互 斥 量 机 制 。 

Fearne hl ARES TSAR MAAK. RRA RA RRR OE MRR 
FE ,这 里 也 使 用 互 斥 量 来 防止 对 系统 系统 库 内 部 的 数据 结构 的 访问 冲突 。 


14.7.58 屏幕 控制 线程 


使 用 互 斥 量 并 不 基 防 止 屏幕 控制 冲突 的 惟一 方法 。 另 一 个 方法 就 是 创建 一 个 新 的 线程 
来 处 理 所 有 对 屏幕 控制 函数 的 调用 ,如 图 14. 13 Bo, 
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每 个 移动 的 图 片 由 一 个 独立 的 线程 控制 。 这 些 
附带 很 多 线 的 进程 线程 将 对 屏幕 画面 的 更 新 请 求 放 入 信箱 中 





— ma ”一 个 线程 接收 
pr 到 对 屏幕 的 更 
新 请 求 ， 然 后 
处 理 用 户 输入 NSNAAN 
es 函数 
输出 到 屏幕 


图 14.13 独立 处 理 屏 幕 控 制 的 线程 


可 以 把 这 个 屏幕 控制 线程 看 成 在 一 个 大 公司 中 的 公共 关系 部 门 。 任 何 想 要 向 媒体 发 送 
消息 的 部 门 都 必须 向 公共 关系 部 门 发 送 请 求 。 公 共 关 系 部 门 里 的 员工 只 关心 如 何 将 消息 发 
送出 去 。 

其 实 这 个 屏幕 控制 线程 在 功能 上 就 像 这 个 公关 部 一 样 ,任何 希望 向 屏幕 发 消息 的 线程 
都 必须 向 这 个 屏幕 管理 线程 发 送 请 求 。 

采用 这 种 机 制 之 后 ,每 个 线程 所 发 送 的 请 求 就 应 该 包含 这 些 信 息 : 行 号 、 列 号 和 消息 字 
符 串 。 控 制 动 画 的 线程 发 出 消息 ,屏幕 管理 线程 接 到 消息 后 ,将 其 显示 在 屏幕 上 。 

这 种 生产 者 (发 消息 线程 ) 一 一 消费 者 (接收 消息 线程 ) 的 设计 类 似 于 前 面 学 习 的 多 线程 
版 的 字数 统计 程序 :需要 一 个 存储 变量 来 放置 消息 ,通过 互 斥 量 来 避免 对 此 存储 变量 的 访问 
冲突 ,以 及 一 个 条 件 变量 ,在 动画 线程 发 送 消息 之 后 ,可 以 通过 这 个 条 件 变 量 将 屏幕 控制 线 
程 唤醒 。 

对 于 屏幕 控制 功能 的 集中 化 和 抽象 化 设计 使 得 程序 更 加 灵活 。 就 算 屏 幕 显 示 系 统 更 换 
了 ,也 只 需 改 变 屏 幕 控制 线程 中 使 用 的 函数 。 屏 幕 控 制 线程 甚至 还 可 以 发 起 同 远 端 显示 服 
务 器 的 一 个 会 话 , 通 过 管道 或 套 接 字 将 消息 发 过 去 ,然而 这 一 切 对 于 控制 动画 的 线程 来 说 都 
是 透明 的 。 改进 这 个 程序 就 留 给 大 家 作为 练习 完成 。 





小 结 
1. 主要 内 容 
+ 执行 线 路 即 为 程序 的 控制 流程 。pthreads 的 线程 库 允许 程序 在 同一 时 刻 运行 多 个 
函数 。 


同时 执行 的 各 函数 都 拥有 自己 的 局 部 变量 ,但 共享 所 有 的 全 局 变量 和 动态 分 配 的 数 
据 空间 。 

当 线 程 共 享 变量 时 ,必须 保证 它们 不 会 发 生 共享 冲突 。 线 程 使 用 互 斥 锁 来 保证 在 某 
一 时 刻 只 有 一 个 线程 在 对 共享 变量 访问 。 

线程 间 通 过 条 件 变量 来 互相 通知 和 同步 数据 。 一 个 线程 挂 起 并 等 待 着 条 件 变量 按照 
某 种 特定 方式 变化 ,而 另 一 个 线程 则 发 信号 使 得 条 件 变 量 发 生变 化 。 

线程 需要 使 用 互 斥 量 来 避免 对 于 共享 资源 操作 函数 的 访问 冲突 。 非 重信 的 函数 必须 
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按照 这 种 方式 进行 保护 ， 
2. 下 一 步 做 什么 
一 个 程序 可 以 包括 若干 进程 ,进程 之 间 遂 过 管道 ,文件 .socket 和 信和 号 进行 通信 。 程 序 也 
可 以 包含 多 个 线程 ,它们 之 间 通 过 共享 变量 ,文件 . 锁 以 及 信和 号 进行 通病 。 前 一 章 主 要 学习 
了 进程 间 的 通信 。 那 么 Unix PRET SPAR? 如 何 为 你 的 应 用 程序 选择 最 合 
适 的 通信 方法 呢 ? 下 -一 章 将 给 出 这 些 问 题 的 管 案 。 
3, 习题 


14.1 


14.3 





线程 基本 操作 的 练习 。 对 hello multi. c 做 如 下 修改 : 

首先 ,多 加 几 条 消息 到 程序 中 ,接着 为 新 加 的 消息 创建 线程 。 

然后 修改 print, msg 肾 数 中 的 循环 次 数 , 使 其 与 所 要 打印 的 字符 申 的 长 度 一 致 。 
在 每 一 条 pthread_join 语句 之 后 打印 信息 ,以 观察 程序 的 执行 情况 ,并 解释 结果 。 


对 tanimate 使 用 管道 命令 ,tanimate 就 可 以 从 标准 输入 中 读 取 它 的 字符 申 询 表 。 


”那么 如 下 的 命令 


who|tanimate 


就 可 以 起 作用 了 。 将 这 一 功能 添加 进去 并 不 是 一 件 小 事 。 需 要 首先 从 标准 输入 
读 取 字符 行 ,然后 将 标准 输入 重 定向 到 终端 ,这 样 屏幕 控制 线程 就 可 以 非 标准 的 
模式 读 取 字符 了 (打开 /dev/tty 并 将 它 复 制 到 标准 输入 )。 


在 视频 游戏 那 一 章 中 ,大 家 一 定 注意 到 在 代码 的 临界 区 使 用 信号 标记 来 防止 访 
问 溃 突 。 将 信号 标记 和 信和 号 处 理 机 制 与 线程 , 互 斥 锁 以 及 条 件 变 量 机 制 做 一 个 
UE. 


4. 编程 练习 


14.4 


14. 5 


14.6 


f£ hello multi. c 中 , 愿 始 线 程 创建 了 两 个 打印 线 和 可。 写 一 个 新 的 程序 , 存 打 印 
“bello* 的 线程 中 创建 一 个 新 的 线程 来 打印 “worid\n”。 哪 一 个 线程 等 待 打印 
“worldin” 的 线程 返回 ? 为 什么 ? 


twerdcountl,e 用 了 三 个 线程 :初始 线程 和 两 个 计数 线程 ,但 初始 线程 完成 很 少 
的 功能 。 写 一 个 新 程序 ,让 原 线程 统计 第 一 个 文件 的 字数 ,然后 再 创建 一 个 线程 
统计 第 二 个 文件 的 字数 。 这 种 方法 是 否 执 行 得 快 一 点 ? 哪 一 种 设计 更 好 ? 


count. words 辫 数 报错 说 无 法 打开 指定 的 文件 。 尽管 这 样 男 一 个 线程 仍然 继续 
运行 。 这 样 好 吗 ? 修改 程序 使 count words 活 数 在 打 不 开 文 件 的 时 候 调 用 exit 


如何 扩展 twordcount2, c 和 twordeount3, c 中 的 方法 ,让 程序 可 以 在 命令 行 上 接 
收 多 个 文件 ? 修改 这 两 个 程序 使 它们 可 以 在 命令 行 上 接收 任意 数目 的 文件 各。 
哪 一 个 版 本 的 程序 容易 扩展 ? 哪 一 个 更 高 效 呢 ? 








- 462 * 


Unix/Linux HBX pk de e 





14.8 进程 与 线程 : 


14. 


.9 


(1) 写 一 个 新 版 本 的 字数 统计 程序 ,用 fork 为 每 个 文件 创建 新 的 进程 。 需 要 为 
子 进程 设 计 一 个 系统 ,使 它们 可 以 将 结果 传 回 给 父 进程 使 用 。 不 要 使 用 进程 
退出 值 来 返回 这 个 结果 ,因为 这 个 值 不 能 超出 255。 使 用 fork 的 一 个 好 处 就 
是 可 以 使 用 标准 的 we 一 w 命令 来 统计 每 个 文件 中 的 字符 数 。 

(2) 写 一 个 单线 程 的 字数 统计 程序 。 

(3) 将 这 三 个 版 本 的 程序 (进程 .多 线程 和 单线 程 ) 做 一 下 比较 , 哪 一 个 容易 设计 、 
容易 编码 ? 哪 一 个 执行 效率 高 ? 哪 一 个 可 移植 性 好 ? 


扩展 twordcount4. c 程序 ,使 其 在 命令 行 上 可 以 接收 多 于 两 个 交 件 各。 


将 twordcount4, c 中 的 全 局 变量 作为 main ARH ADS E.R RAE TN 
指针 作为 结构 体 的 成 员 。 再 将 结构 体 地 址 传 给 线程 。 


YE twebserv. c 中 加 入 互 斥 锁 来 保护 对 统计 变量 的 访问 。 
删除 tbounceld.c 中 的 所 有 全 局 变量 定义- 一 个 绪 构 体 来 包含 所 有 跳动 文字 的 
信息 。 


tbounceld. c FEAR AP AY TE BIR AS fa SE He BAA el. 如 果 不 如 锁 , 会 导致 什么 样 
的 结果 ?两 个 线程 冲突 会 造成 什么 样 的 结果 ? 








单 宇 符 串 的 动画 程序 包含 了 对 速度 的 控制 。 用 户 可 以 通信 按键 “s” 和 “f" 来 增加 
和 和 降低 动作 间 的 延 时 ,将 速度 控制 加 入 多 字符 串 动 送 程 序 中 。 


tanimate. c 中 所 有 的 消息 都 是 水 平 称 动 的 。 修 改 程序 使 得 一 些 字 符 申 上 下 移 
动 , 而 另 一 些 水 平移 动 。 如 何 来 控制 冲突 ? 


修改 tanimate 程序 ,使 用 一 个 单独 的 线程 进行 屏幕 管理 。 控 制 动 画 的 线程 必须 
先 将 消息 发 送 给 屏幕 管理 线 释 ,由 屏幕 管理 线程 对 消息 进行 显示 。 


MT finger 服务 器 需要 一 个 多 线程 的 服务 器 来 提供 服务 。 服 务 器 每 次 接收 一 行 
输入 。 然 后 服务 器 在 数据 库 中 查询 这 个 字符 串 , 再 将 匹配 这 个 字符 串 的 记录 返 
同 给 客户 端 。 服 务 器 运行 包含 如 下 步骤 : 

《1) 将 用 户 数据 库 载 入 内 存 ; 

(2) 为 每 一 个 请 求 创建 一 个 独立 线程 (detached thread); 

(3) 服务 器 记录 每 秒 钟 所 匹配 的 记录 的 数目 ， 

(4) 对 于 STATUS 的 特殊 请 求 ,服务 器 将 返回 统计 数据 ; 

(5) 在 接收 到 SIGHUP 消息 之 后 ,服务 器 刷新 其 内 部 数据 库 。 


在 tanimate 那 一 节 的 结尾 ; 曾 讨论 了 如 何 将 显示 功能 与 计时 各 数据 人 处 理 逻 辑 分 
开 。 写 一 个 客户 /服务 器 版 本 的 tanimate 程序 ,用 数据 报 的 socket 将 简单 的 请 
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显示 服务 器 支持 包含 如 下 两 条 命令 的 简单 协议 : 

CLEAR clears the display 

DRAW RC Any string puts "Any string" at row R,column C 

修改 后 的 版 本 不 青 需要 调用 屏幕 控制 函数 。 它 只 和 需 身 显示 服务 器 发 送 消 息 。 
显示 服务 器 接收 这 些 信息 ,然后 把 消息 中 包含 的 字符 申 显 示 出 来 。 存 做 这 道 题 
目的 时 候 , 可 以 去 研究 Unix 使 用 的 X11 window 系统 的 没 计 思想 。 
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概念 与 技巧 

^ 挂 起 并 等 收 从 多 个 源 喘 的 输入 : select 和 poll 
- 命名 管道 

”共享 内 在 

* 文件 锁 

* 信号 量 

* IPC(InterProcess Communication) £s Ws 
相关 的 系统 调用 与 西数 

* select,poll 

* mkfifo 

* shmget,shmat,shmctl , shmdt 

* semget,semcetl,semop 

相关 命令 

* talk 

* lpr 


15.1. 编程 方式 的 选择 


很 入 以 前 , 当 两 人 试图 互相 交流 的 时 候 , 可 选择 的 方式 非常 的 少 ; 交谈 或 者 投掷 石 块 。 
当代 大 们 的 选择 多 了 很 多 : 蜂窝 电话 .电子 邮件 .信件 .特快 专递 .自行 车 投递 .网 络 电话 、 纸 
张 . 显 示 表 上 贴 的 备忘录 等 ,当然 也 可 以 直接 交谈 或 投 撕 石 内。 每 种 方法 都 有 其 优点 和 证 
点 。 那 么 人 们 如 何 选择 其 交流 方式 昵 ? 

作为 一 名 Unix 程序 员 ,必须 学 会 如 何 选择 进程 间 通 信 的 方法 .每 一 种 方式 都 有 其 优 缺 
点 :如何 进行 选择 呢 ? 

本 章 从 学 习 talk 开始 。 人 们 使 用 talk 来 互相 发 送 消息 ,并 将 会 比较 讨论 各 种 Unix 方 
法 ,看 看 它们 是 如 何在 进程 问 传递 消息 的 。 
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15.2 talk 命令 : 从 多 个 数据 源 读 取 数据 


Unix 的 talk 命令 是 一 种 通信 工具 。talk 允许 人 们 在 终端 间 传送 信息 。talk 甚至 可 以 跨 
越 Internet 来 连接 不 同 机 器 的 终端 ,如 图 15. 1 所 示 。 


hosti 对 话 进程 





socket socket 





图 15.1 talk 连接 网 络 上 的 两 个 终端 


使 用 talk 命令 的 时 候 , 屏 幕 被 分 为 上 下 两 个 部 分 ,用 户 以 字符 终端 模式 来 操作 。 输 入 字 
符 的 时 候 ,字符 会 同时 显示 在 两 个 窗口 中 。 你 所 输入 的 字符 会 出 现在 上 面 的 窗口 中 ,而 对 方 
输入 的 字 出 现在 下 面 的 窗口 中 。talk 使 用 socket 进行 通信 ,如 图 15. 2 BER. 





图 15.2 talk 命令 的 工作 方式 


talk 命令 读 取 字 符 并 将 它们 写 到 目的 地 。 但 与 所 学 过 的 其 他 程序 不 同 ,talk 同时 等 待 从 
两 个 文件 描述 符 的 输入 。 


15.2.1 同时 从 两 个 文件 描述 符 读 取 数据 


talk 从 键盘 和 socket 接收 数据 。 从 键盘 输入 读 取 的 字符 被 复制 到 屏幕 中 上 半 个 窗口 ， 
并 通过 socket 发 送出 去 。 同 样 从 socket 读 人 的 字符 被 添加 到 屏幕 下 面 的 窗口 中 。 

talk 的 用 户 可 以 以 任意 速度 和 任意 顺序 输入 字符 。talk 程序 就 必须 在 任何 时 刻 都 准备 
好 从 任 一 数据 源 接收 字符 ,而 不 像 其 他 的 程序 可 以 依靠 明确 的 协议 。 服务 器 等 待 着 read 或 
recvfrom 的 请 求 ,并 用 write 或 sendto 发 回 一 个 应 答 。 用 户 不 可 能 一 直 在 切换 自己 的 角色 
(输入 完 之 后 等 待 别人 的 应 答 ,然后 再 输入 ……: ) ,那么 talk 程序 如 何 解决 这 个 问题 呢 ? talk 
当然 也 不 能 这 样 做 ,如 下 述 代码 : 


while(1)1{ 


read(fd_kbd,&c,1); /* read from keyboard «/ 
waddch( topwin,c) ; /* add to screen «/ 
write(fd sock,$c,1); /* send to other person x/ 
read(fd sock,&c,1); /* read from other person x/ 


waddch(botwin,c) ; /* add to screen #/ 
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控 照 上 述 代码 的 逻辑 ,如 果 对 方 一 直 在 输入 信息 ,而 你 却 一 直 在 看 他 发 的 消息 ,自己 设 
AMAT MARSELA? 程序 在 第 一 个 read 调用 的 时 候 就 挂 起 了 ,并 不 会 从 你 的 对 方 
那里 读 取 数据 。 上 面 的 方法 只 有 在 用 户 趟 断 切 搞笑 己 角 色 的 时 候 才 可 以 正常 工作 。 

这 里 通过 调用 fcnti 函数 将 文件 描述 符 设 置 为 O_NONBLOCK 标志 从 而 使 文件 描述 符 
变 成 非 阻塞 模式 。 使 用 非 阻 塞 模式 使 得 对 于 read 的 调用 立即 返回 。 这 个 时 候 , 如 果 并 没有 
宁 符 可 以 读 取 ,read 调用 返回 零 。 昌 然 非 阻塞 的 方式 可 以 工作 ,人 是 它 占 用 了 太守 的 处 理 器 
上 时间。 由 于 等 次 调用 read 都 是 一 个 系统 调用 ,程序 就 必须 回 到 内 核 模式 工作 ， 这 样 存 等待 
一 个 字符 到 来 之 前 系统 可 能 会 切换 上 于 次 。 





15.2.2 select 系统 调用 


Unix 系统 提供 了 系统 调用 select, 它 允许 程序 挂 起 ,并 等 待 从 不 止 一 个 文件 描述 符 的 输 
人 。 它 的 原理 很 简单 : 

OD 获得 所 需要 的 文件 描述 符 列 表 ; 

(20 将 此 列表 传 给 select; 

(3) select 挂 起 直到 任何 一 个 文件 描述 符 有 数据 到 达 ; 

(4) select 设置 一 个 变量 中 的 若干 位 ,用 来 通知 你 哪 一 个 文件 描述 符 已 经 有 输入 的 数据 。 

THREF selectdemo. c 等 竺 两 个 设备 土 数据 到 达 : 





/* selectdemo.c , watch for input an Lwo devices AND timeout 


x usage. gelectdemo devl dev? timeout 

x action; reports on input from each file, and 
* reports timeouts 

xf 


# include  «stdio. hz 

# include  —sys/time. hoc 
T include  -sys/types.h-— 
# include <unistd.h> 

# include <lfentl.ho> 


it define oops(m,x) ( perror(m); exit(x); | 


main(int ac, char * av[ ]) 


i 


int fdi, fd2; /* the fds to watch «/ 
struct timeval timeout; /* how long to wait */ 

fd set readfds. /* watch these for input x/ 
int maxfd; /* max fd plus 1 «/ 

int retval, /* return from select */ 


if(Can l= 4 yf 


fprintf(stderr, "usage. & s file file timeout "o * av): 











exit(1); 

t 

/** open files x «/ 

if ( (fdl = open(av[1],0 RDONLY)) == -1) 
oops(av[1], 2); 

if € (fd2 = open(av[2],0 RDONLY)) == -1) 


oops(av[2;, 3); 
maxfd = 1 + (fdic-fd27 fdl,fd2); 


while(1) | 


/** make a list of file descriptors to watch x* «/ 


FD ZERO(&readfds? ; /* clear all bits «/ 
FD SET(fdl, &readfds) ; /* set bit for fdi »/ 
FD SET(fd2, &readfds) ; /* set bit for fd2 «/ 


/** set timeout value « x/ 


timeout.tv sec = atoi(av[3]; /* set seconds «/ 


timeout.tv usec = 0; /* no useconds x/ 


/** wait for input « «/ 
retval = select(maxfd,&readfds, NULL, NULL, &timeout} ; 
if ( retval == -1) 
oops( "select", 4); 
if ( retval > 0} 
/* * check bits for each fd x «/ 
if ( FD ISSET(fdl, &readfde) ) 
showdata(av[ 1], fd); 
if ( FD ISSET(fd2, &readfds) ) 
showdata(av[ 2], fd2); 
} 
else 


printf("no input after $d seconds\n", atoi(av[3]); 


} 
showdata(char * fname, int fd) 
1 

char buf[BUFSIZ |; 


int n; 


printf(" €5s, ", fname, n); 
fflush(stdout); 
n = read(fd, buf, BUFSIZ); 
if (n == -1) 
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oops(fname, 5); 
write(l, buf, n); 
write(i, "An", 1); 

} 


上 面 的 代码 遵循 了 前 而 所 烈 出 的 四 步 。 交 件 描述 符 到 天 以 二 进 制 位 方式 存储 在 fd, set 


类 型 的 变量 中 。 宏 FD ZERO,FD SET 和 FD_ISSET 先 将 fd_set 中 所 有 位 清除 ,然后 为 某 
文件 描述 符 设 置 一 位 ,再 对 该 位 进行 监 昕 。 和 希望 同时 对 两 个 文件 描述 符 监 听 , 因 此 调用 了 两 
次 FD SET, 





select 调用 同时 也 接受 对 于 超时 的 处 理 。 如 果 在 指定 的 时 间 内 ,没有 数据 到 达 , select 将 


直接 返回 ,在 selectdemo. c 中 ,在 命令 行 接收 一 个 字符 串 作 为 超时 的 时 间 值 。 FAP afi te 
RIXUBE ETT MA : 


5 cc selectdeno.c - o selectdenmo 

5 ./selectdemo /dev/tty /dev/mouse 10 
hello 

/dev/tty, hello 


no input after 4 seconds 
no input after 4 seconds 
LesLing 

/dev/tty: testing 

FREE HT HR 
/dev/mouse, í 

/dev/ mouse; 


/dev/mouse, y 


这 个 例子 展示 了 程序 如 何等 待 键盘 或 鼠标 输入 的 到 来 。 当 然 大 家 可 以 设计 更 加 有 意思 


的 程序 ,不 只 是 将 输入 打印 出 来 ,并 且 对 输 和 人 进行 特定 的 处 理 ， 














select 调用 小 颖 如 下 。 
select 
目标 同步 的 L/O 复 用 
3x4 # include «Zsys/time, h> 
函数 原型 int = select cint numfds, 


id sei * read set, 

Íd set * write set, 

fd sei x error. set, 

struct Umeval + timeout) ; 
void FD. ZERO(Íd set. « fdset) 
void FD SETCint fd. fd, set. * fdsct) 
void FD_CLR¢int fd, fd set. « fdset) 
void FD_ISSET (int fd, fd sct. « fdset) 


SSS 
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select 
参数 numfds 需要 收听 的 最 大 f 值 加 1 
read set 等 待 从 此 集合 包括 的 文件 描述 符 到 来 的 数据 
write set 等 待 向 这 些 文 件 描述 符 写 数据 的 许可 
error set 等 待 这 些 文件 描述 符 操 作 的 异常 











timeout 超过 此 时 间 后 函数 返回 
返回 值 一 1 E E 
0 超时 
num 满足 需求 的 文件 描述 符 的 数 晶 


select 同时 监视 多 个 文件 描述 符 。 在 指定 情况 发 生 的 时 候 , BR, TEM — A, 
select 监听 在 三 组 文件 描述 符 上 发 生 的 事件 , 检查 第 一 组 是 否 可 以 读 到 ,检查 第 二 组 是 否 可 
以 写 人 ,检查 第 三 组 是否 有 异常 发 生 。 每 一 组 的 文件 描述 符 被 记录 到 一 个 二 进 制 位 的 数组 
中 。 这 里 的 numfds 怡 好 等 于 需要 监听 的 最 大 的 文件 描述 符 加 1。 

当 参 数 指定 的 条 件 被 满足 或 超时 的 时 候 ,sclect 画 数 返回 。 若 指定 的 条 件 被 满足 ,selecet 
返回 满足 条 件 的 文件 描述 符 的 数目 。 

车 任 一 参数 为 null, select HAM SR. 


15.2.3 select 与 talk 


本 章 并 不 打算 把 talk 的 程序 写 出 米 , 因 为 关于 定位 基 他 的 用 户 和 建立 连接 还 有 很 多 步 
SE i MB: 定位 对 方 用 户 就 需要 搜寻 utmp 文件 。 大 家 已 经 党 习 这 实现 其 他 所 有 步 又 
所 需 的 知识 和 技巧 了 。 其 他 还 有 哪些 步骤 观 ? 它们 需 鉴 哪些 系统 调用 ?这 两 个 问题 就 留 给 
大 家 回答 了 。 


15.2.4 select 5j poll 


也 可 以 便 用 poll 调用 来 代替 select 的 功能 ，selecet 是 由 Berkeley 研制 出 来 的 ;而 poll W 
是 册 尔 实验 室 的 成 果 。 这 两 考 完 成 类 似 的 功能 ,而 现代 的 大 部 分 的 Unix 版 本 对 于 两 者 都 
支持 。 





15.3 通信 的 选择 


talk 命令 是 Unix 系统 程序 的 一 个 很 好 的 例子 , 它 很 好 地 体现 了 进程 同 如 何 进 行 通信 和 
分 工会 作 。talk 中 的 两 个 进程 读 写 消息 ,就 好 像 消息 是 被 存储 在 常规 的 磁盘 上 一 样 。 

talk 中 的 文件 描述 符 分 别 对 应 了 键盘 .屏幕 和 socketa A 15.3 所 示 ) ,但 它们 仍然 可 以 
被 连接 到 其 他 进程 或 其 他 设备 上 去 。talk 程序 中 的 进程 癌 数 据 传 输 与 进程 间 的 操作 都 是 极 
为 重要 的 部 分 。 要 知道 选择 一 个 好 的 通信 方式 和 选择 正确 的 算法 或 数据 结构 一 样 的 重要 。 
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写 人 文件 描述 符 





读 写 文件 描述 符 
读 入 文件 描述 符 


图 .15.3 三 个 文件 描述 符 


15.3.1. 一 个 问题 的 三 种 解决 方案 


问题 : 从 服务 器 得 到 数据 ,将 其 传 给 客户 端 , 如 何 来 决定 选择 哪 一 种 通信 方法 呢 ? 18— 
想 前 面 使 用 流 socket 写 过 的 时 间 / 日 期 服务 器 。 某 一 进程 知道 当前 的 时 间 ,而 另 一 进程 想 获 
取 时 间 信息 (如 图 15.4 PAR) ,如何 让 一 个 进程 从 另 二 个 进程 得 到 数据 呢 ? 


客户 端 服务 器 


15.4 某 进 程 拥有 另 一 进程 所 要 获得 的 信息 


三 种 解决 方案 : 文件 ,管道 ,共享 内 存 。 图 15. 5 展示 了 三 种 不 同 的 方法 : 一 种 是 已 经 学 习 
过 的 ,但 另外 的 两 种 方法 却 是 新 的 。 大 家 所 熟悉 的 方案 是 使 用 文件 ,而 另外 的 两 种 新 方案 是 合 
名 管道 (named Pipe) 及 共享 内 存 段 (share memory segment) 策 略 。 这 些 方法 分 别 通过 磁盘 .内核 
以 及 用 户 空间 进行 数据 的 传输 。 那么 每 种 方法 具体 如 何 应 用 ? 各 有 何 优 缺 点 呢 2 





从 管道 传递 数据 | Ce 文件 来 共享 数据 
图 .15.5， 三 种 传输 数据 的 方法 


15.3.2 通过 文件 的 进程 间 通信 


进程 间 可 以 通过 文件 来 进行 通信 。 某 进程 将 数据 写 人 文件 , 别 的 进程 再 将 数据 从 文件 
中 读 出 。 

CD 使 用 文件 进行 通信 的 时 间 / 日 期 服务 器 

这 里 不 必 写 一 个 完整 的 C 程序 ,下 面 的 二 个 shell 脚本 就 可 以 完成 任务 了 。 


#1 /bin/sh 
# time server — file version 
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while true ; do 
date — /temp/current date 
sleep 1 


done 


此 服务 器 每 隔 1OEP ORG P RU RS Te] ASS A Oe aE] E" HK 
件 内 容 删除 然后 重 写 。 

(2) 使 用 文件 进行 通信 的 时 间 / 日 期 客户 器 

客户 端 读 取 文件 的 内 容 : 


#! /bin/sh 
# timeclient - file version 


cat /tmp/current date 


(3) 使 用 文件 的 IPC 小 结 

访问 控制 : 客户 端 必须 能 够 读 取 文 件 。 通 过 使 用 标准 文件 访问 权限 ,可 以 给 予 服务 器 写 
权限 并 且 限 制 客户 端 只 有 读 权 限 。 

多 客户 端 : 任意 数目 的 客户 可 以 同时 从 文件 中 读 取 数据 。Unix 并 不 限制 同时 打开 同一 
文件 的 进程 数目 。 

竞 态 条 件 : 服务 器 通过 清空 内 容 再 重 写 的 方法 来 更 新 文件 。 如 果 某 客户 恰好 在 清空 和 
重 写 之 间 读 取 文件 ,那么 它 得 到 的 将 是 一 个 空 的 或 只 有 部 分 的 内 容 。 

避免 竞 态 条 件 : 服务 器 和 客户 端 可 以 使 用 某 种 类 型 的 互 斥 量 来 避免 竞 态 条 件 。 后 面 的 
章节 中 大 家 将 会 学 到 文件 锁 的 方法 。 另 外 ,如 果 服 务 器 在 程序 中 使 用 lseek 和 write 函数 来 
BHR create, 这 样 文件 永远 都 不 可 能 为 空 , 因 为 write 是 一 个 原子 操作 , 它 不 会 在 执行 中 被 
打 断 。 


15.3.3 命名 管道 


通常 的 管道 只 能 连接 相关 的 进程 。 常 规 管道 由 进程 创建 ,并 由 最 后 一 个 进程 关闭 。 

使 用 命名 管道 可 以 连接 不 相关 的 进程 ,并 且 可 以 独立 于 进程 存在 (如 图 15. 6 所 示 )。 称 
这 样 的 命名 管道 为 FIFO( 先 进 先 出 队列 )。 FIFO 类 似 于 放 在 草坪 上 的 一 段 给 花园 浇 水 的 水 
管 。 任何 人 都 可 以 将 此 水 管 的 一 端 放 在 自己 的 耳 打 边 ,而 另 一 个 人 通过 水 管 向 对 方 说 话 ， 
人 们 可 以 通过 此 水 管 进行 交流 ,而 在 没有 人 使 用 的 时 候 , 水 管 仍 然 是 存在 的 。FIFO 可 以 看 
作 由 文件 名 标志 的 一 根 水 管 。 





pipe ( ) mkfifo ( ) 
图 15.6 FIFO 与 进程 独立 
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1. 使 用 FIFO 

OD 如 何 创 建 FIFO? 

HE PRÉ mkfifoCchar * name, mode t mode) 使 用 指定 的 权限 模式 来 创建 FIFO, mkfifo 
命令 通常 调用 这 个 函数 ， 

(2) Su fer aH RR FIFO? 

Æ BUT BIER 3c. unlink Cfifoname) 函数 可 以 用 来 删除 FIFO, 

(3) 如 何 监 听 FIFO 的 连接 ? 

使 用 open(fifoname, O RDONL YO RK. open 两 数 阻塞 进程 直到 某 一 进程 打开 FIFO 
进行 写 操作 。 

(4) spi xt FIFO 开始 会 话 ? 

使 用 open(fifoname,O WRONL YO AR. shit open RAP SHE A a RvR 
FIFO 进行 读 取 操作 。 

(5) 了 商 进 程 如 何 通过 FIFO 进行 通信 ? 

发 送 进程 用 write 调用 ,而 监听 进程 使 用 read 调用 。 写 进程 调用 close 来 通知 读 进 程 通 
信和 结束 。 

FERA shell 脚本 是 基于 FIFO 的 时 间 / 日 期 服务 的 服务 器 和 客户 端 程序 : 


#1! /bin/sh 


# time server 





while true ; do 
rm — f /tmp/time fifo 
mkfifo /tmp/time fifo 
date > /tmp/time fifo 
done 
#1 /bin/sh 
4 time client 


cat /tmp/time fifo 


2. FIFO 类 型 的 IPC 小 结 

WR): FIFO 使 用 与 通常 文件 相同 的 文件 访问 。 服 务 器 有 写 权限 ,而 客户 端 只 限于 读 
权限 。 

多 个 客户 端 : 命名 管道 是 一 个 队列 而 不 是 常规 文件 ， 写 者 将 字 节 写 人 队列 ,而 读者 从 队 
列 头 部 移出 宇 节 。 每 个 客户 端 都 会 将 时 间 / 日 期 的 数据 移 测 队列 ,因此 服务 器 必须 重 写 数 据 。 

RASA: FIFO 版 本 的 时 间 / 日 期 服务 器 程序 完全 不 存在 竞 态 条 件 问题 。 在 信息 的 长 
度 不 超过 管道 的 容量 的 情况 下 ,read 和 write 系统 调用 只 是 原子 操作 。 读 取 操作 将 管道 清空 
而 写 入 操作 又 将 管道 塞 满 。 在 读者 和 写 者 连通 之 前 ,系统 内 核 将 进程 挂 起 。 因 此 锁 机 制 在 

时 间 / 日 期 服务 器 将 数据 写 人 FIFO 后 ,将 自己 挂 起 直到 客户 端 打开 FIFO 来 读 取 数据 。 
TERE n TRE HE B SR A RA FIFO 中 读 取 数据 ,然后 等 待 客户 端 把 数据 写 人 。 大 家 想 想 看 
有 没有 服务 器 等 待 客户 端 输 人 的 例子 ? 
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15.3.4 共享 内 存 

字 节 流 是 如 何 通过 文件 或 FIFO 来 传输 的 ? write 将 数据 从 内 存 复制 到 内 核 缓存 中 。 
read 将 数据 从 内 核 缓存 复制 到 内 存 中 。 

如 果 进 程 运 行 在 用 户 空间 的 不 同 部 分 ,进程 间 是 如 何 将 数据 从 内 核 缓 存 中 复制 进 复制 
出 的 呢 ? 同一 个 系统 里 的 两 个 进程 通过 使 用 共享 的 内 存 段 来 交换 数据 。 共 享 的 内 存 段 是 用 
户 内 存 的 一 部 分 。 每 一 个 进程 都 有 一 个 指向 此 内 存 段 的 指针 (如 图 15. 7 所 示 )。 依 靠 访 问 权 
限 的 设置 ,所 有 进程 都 可 以 读 取 这 一 块 空间 中 的 数据 。 因 此 进程 间 的 资源 是 共享 的 ,而 不 是 
被 复制 来 复制 去 的 。 共 享 内 存 段 对 于 进程 而 言 ,就 类 似 于 共享 变量 对 于 线程 一 样 。 


共享 内 存 可 以 





允许 一 个 进程 
直接 将 数据 放 
入 另 一 个 进程 
的 内 存 空间 中 
使 用 管道 需要 两 
次 复制 数据 


15.7 两 个 进程 共享 一 块 内 存 区 域 


l. 共享 内 存 段 的 一 些 基本 概念 

。 共享 内 存 段 在 内 存 中 不 依赖 于 进程 的 存在 而 存在 。 

。 共享 内 存 段 有 自己 的 名 字 , 称 为 关键 字 (key) 。 

。 关键 字 是 一 个 整 型 数 。 

。 共享 内 存 段 有 自己 的 拥有 者 以 及 权限 位 。 

。 进程 可 以 连接 到 某 共 享 内 存 段 ,并 且 获 得 指向 此 段 的 指针 。 

2. 使 用 共享 内 存 段 

(1) 如 何 得 到 共享 内 存 段 ? 

int seg id 一 shmget(key，size 一 of- segment, flags) 

如 果 内 存 段 存 在 ,函数 shmget 找到 它 的 位 置 。 如 果 不 存 在 ,可 以 通过 在 flags 值 中 指定 
一 个 创建 此 段 和 初始 化 权限 模式 的 请 求 。 

(2) 如 何 将 进程 连接 到 某 个 共享 内 存 段 ? 

void ptr = * shmat(seg_id, NULL, flags) 

shmat 在 进程 的 地 址 空间 中 创建 共享 内 存 段 的 部 分 ,并 返回 一 个 指向 此 段 的 指针 。flags 
参数 用 来 指定 此 内 存 段 是 否 为 只 读 。 

(3) 如 何 与 共享 内 存 段 进 行 读 写 交 互 ? 


strcpy(ptr, "hello") ; 
memcpy() ptr[i 训 及 其 他 一 些 通用 的 指针 操作 。 
3. 使 用 共享 内 存 段 的 时 间 / 日 期 服务 器 


'* shm ts.c ; the time server using shared memory, a bizarre application x/ 
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finclude — «stdio. h> 
f include <(sys,/shm. ho 


d include «timc. h> 


d define TIME MEM KEY 99 
H define SEG SIZE ((size t)100) 


# define 





main() 


{ 


int seg id; 
char mem ptr, * ctime(); 
long now; 


int n; 


F 


/* create a shared memory segment «/ 


seg id = shmget( TIME MEM KEY, SEG SIZE, IPC CREAT|Q777 ); 


if ( seg id == 13 
oops("shmget", 1); 





/* like a filename */ 


/* size of segment «/ 


oopsim,x) | perror(m); exit(x); } 


/* attach to it and get a pointer to where it attaches x/ 


mem ptr = shmat( seg id, NULL, 0); 


if ( mem ptr == ( void +} —1) 
oops("shmat", 2); 


/* run for a minute x/ 
for (n=0; n«260; nt * )( 
timet now J; 
strcpy(mem ptr, etime(&now)); 


sleep(1); 


/* now remove it +/ 
shmetl¢ seg id, IPC RMID, NULL; 


/* get the time x/ 
/* write to mem «/ 


/* wait a sec #/ 


4, JEEP EE ERAS Bp / HJ S3 


/* shm tc.c , 


# include <stdio.h> 
# include «Zays/shm. h > 
H include «tine. h> 


# define TIME MFM KEY 99 
define SEG SIZE ((size t)100) 


# define 


/* kind of like a port number «/ 
/* size of segment */ 


oops(m,x) { perror(m); exit(x); } 


the time client using shared memory, a bizarre application */ 
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maint } 


int seg id; 
Char — * mem ptr, * ctime(); 
long now; 
/* create a shared memory segment «x/ 
seg id = shmget( TIME MEM KEY, SEG SIZE, 0777 ); 
if ( scg id == 13 
oops( "shnget",1); 
/* attach to it and get a pointer to where it attaches «/ 
mem ptr = shmat( seg id, NULL, 0 5; 
if ( mem ptr == ( void +) -1) 
copst "shmat",2); 


printf("The time, direct from memory: .. & s", mem ptr); 


shmdt{ mem ptr ); /* detach, but not needed here «/ 


} 


5. 共享 肉 存 段 类 型 的 IPC 小 结 

访问 : 客户 端 必须 有 对 共享 内 存 段 的 读 权 限 ， 共享 内 存 段 拥 有 一 个 权限 系统 , 它 的 工作 
原理 和 文件 权限 系统 类 似 。 共 享 内 存 且 有 髓 蔬 的 拥有 者 并 且 为 用 户 ,组 或 其 他 成 员 设置 了 
权限 位 ,来 控制 他 们 各 自 的 访问 权限 。 正 因为 有 如 此 特性 , 才 可 以 让 上 服务 器 只 有 写 权 限 而 客 
广 端 只 有 读 权 限 。 

多 个 客户 ; 任意 数目 的 客户 都 可 以 局 时 从 共享 内 存 段 读数 据 。 

FSR. 服务 器 通过 调用 一 个 运行 在 用 户 空间 的 库 函 数 strepy 来 更 新 共享 的 内 存 段 。 
如 果 客 户 端正 好 在 服务 器 向 内 容 段 中 写 人 新 数据 的 时 候 来 访问 内 让 段 ,那么 它 可 能 工读 到 
新 数据 也 读 到 老 数 据 ,: 

避免 竟 态 条 件 , 服务 器 和 客 卢 段 必须 使 用 相同 的 系统 来 对 资源 加 锁 。 内 核 提 供 了 一 种 
进程 间 加 锁 的 机 制 , 称 为 信 叶 量 机 制 。 在 下 一 节 中 将 会 学 习 这 种 机 制 。 


15.3.5 SAGER AIRE AKO 


RM fe ER Te RIVE — ^ ERE B — P IEFEGEBITT AB. HMMA — 41-27 HE RT LL 
达到 要 求 。 窜 户 端 从 服务 器 端 得 到 它们 想 要 的 数据 。 前 面 已 经 介绍 了 四 个 版 本 的 客户 / 服 
务 器 系统 ,甚至 还 可 以 写 出 使 用 数据 报 或 Unix 域 地 址 的 新 版 本 。 不 过 如 何 决定 到 底 用 哪 一 
种 方法 来 实现 呢 ? 有 什么 选择 标准 吗 ? 

CD 速度 

通过 文件 或 命名 管道 来 传 输 数 据 需 要 更 多 的 操作 。 系 统 内 核 将 数据 复制 到 内 核 空间 
中 ,然后 再 切换 回 用 户 空间 。 对 于 利用 文件 进行 传输 来 说 ,内 核 将 数据 复制 到 磁盘 上 ,然后 
将 数据 再 从 磁盘 上 复制 出 去 。 实 际 上 ,在 存储 器 中 存储 数据 比 想象 中 要 复杂 的 多 。 虚 拟 内 
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存 系统 允许 用 户 空间 中 的 段 交 换 到 磁盘 上 ,因此 就 是 共享 内 存 段 机 制 同样 也 包括 了 对 磁盘 

(2) 连接 和 无 连接 

文件 和 共享 内 存 段 就 像 公 告 牌 一 样 。 数 据 产生 者 将 信息 贴 在 公告 牌 上 ,多 个 消费 者 可 
以 同时 从 公告 牌 十 阅读 信息 。FIFQO 要 求 建立 连接 ,因为 在 内 核 转 换 数 据 之 前 ,读者 和 写 者 
都 必须 等 待 着 FIFO 被 打开 ,并且 也 只 有 一 个 客户 可 以 阅读 此 消息 。 流 socket 是 面向 连接 
的 ,而 数据 报 socket 则 不 是 。 在 某 些 应 用 程序 中 ,这 些 区 别 起 着 关键 性 的 作用 。 

(3) 范围 

你 希望 穆 序 中 的 消息 能 传送 多 远 的 距离 呢 ” 共 享 内 存 和 命名 管道 只 允许 本 机 上 的 进程 
之 闻 通 信 。 通 过 文件 进行 传输 可 以 允许 不 同 机 器 上 的 进程 进行 通 依 。 千 用 IP 地 址 的 socket 
可 以 与 不 同 机 器 上 的 进程 进行 通信 ,而 使 用 Unix 地 址 的 socket 却 不 能 。 这 样 ,使 用 哪 -- 种 
方法 进行 通信 就 版 决 于 通信 实体 问 的 距离 了 。 

(4) 访问 限制 

你 是 希望 所 有 人 都 能 与 服务 器 通信 还 是 只 有 特定 权限 的 用 户 才 行 ” 文件 .FIFO, 共 享 内 
存 以 及 Unix 地 址 socket 都 提供 标准 的 Unix 文件 系统 权限 。 而 Internet socket 则 不 行 。 

(5) 竟 态 条 件 

使 用 共享 内 存 和 共享 文件 要 比 使 用 管道 和 socket 麻烦 。 管 道 和 socket Hi KS 
的 队列 。 写 者 将 数据 放 进 一 端 ,而 读者 则 从 另 一 端 将 数据 读 出 ,进程 并 不 需要 考虑 其 内 部 
9M. 

然而 对 于 共享 文件 和 共享 内 存 的 访问 却 不 是 由 内 核 进行 管理 的 。 如 果 某 进程 在 读 文 件 
的 过 程 中 , 另 一 个 进程 正在 对 文件 进行 重 写 , 读 进程 读 到 的 很 可 能 就 是 不 完整 或 不 一 致 的 数 
括 。 下 一 节 将 会 介绍 文件 锁 和 信和 号 量 的 应 用 。 


15.4 ”进程 之 间 的 分 工 合作 


如 何 处 理 这 些 令 人 恼火 的 意 太 条 件 呢 ? 客户 和 服务 器 苦 通 过 共享 文件 或 内 存 的 方式 来 
进行 通信 ,又 如 何 来 保证 它们 正常 运行 而 不 出 现 冲 突 呢 ? 它们 如 何 分 工 合作 ? 本 节 将 介绍 
进程 在 访问 共享 资源 时 所 使 用 的 技术 : 文件 锁 和 信和 号 量 。 


15.4.1 文件 锁 


l. Ar 

考虑 两 种 类 型 的 问题 。 首 先 , 当 客 户 试图 读 取 文件 时 ,服务 器 正在 重 写 文 性 ,结果 会 如 
何 呢 ? 客户 读 出 来 的 可 能 就 是 不 完整 的 数据 。， 上 面 所 提 到 的 日 期 /时 间 般 务 器 下 太吉 能 遇 
到 这 个 问题 ,因为 其 消息 比较 短 , 重 写 时 间 较 少 。 但 如 果 是 天 气 预报 服务 器 ,其 交 王 的 消息 
比较 长 ,就 有 可 能 遵 到 竞 态 问 题 。 因 此 , 当 服 务 丹 在 重 写 文件 的 时 候 ,客户 必须 等 待 服务 器 
完成 之 后 才能 开始 读 。 

再 考虑 一 下 正好 相反 的 情况 。 当 客户 正在 一 行 一 行 读数 据 的 时 候 , 服 务 器 罕 然 把 文件 
抢 过 来 ,将 内 容 删除 ,然后 开始 重 写 数 据 。 客 户 端 看 著 文 件 从 自己 眼皮 底下 被 抢 过 去 而 无 能 
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等 ,因为 多 个 进程 一 起 读 文 件 不 会 带 来 任何 风险 。 

为 了 避免 这 些 问 题 , 需 要 两 种 类 型 的 锁 。 第 一 种 类 型 为 写 数据 锁 , 它 告诉 其 他 进程 :“ 我 
在 写 文 件 , 在 完成 之 前 任何 人 痢 必 须 等 待 .” 第 二 种 类 型 的 锁 为 读数 据 锁 , 它 告诉 其 他 进程 ; 
“我 在 读 文 件 ,要 号 文件 必须 等 我 完成 ,要 读 文 件 的 不 受 影 响 。” 

2. 使 用 文件 锁 进 行 编程 

Unix 提供 了 3 种 方法 锁 住 打开 的 文件 : flock,lockf 和 fentl。 三 者 中 最 灵活 各 移植 性 最 
好 的 应 该 是 fcntl。 

下 面 使 用 fcntl gx tr. 

(1) 如 何 给 已 经 打开 的 文件 加 读数 据 锁 ? 

使 用 fentl(fd, F_SETLKW, &.lockinfo) 

第 一 个 参数 是 该 文件 对 应 的 文件 描述 符 。 第 二 个 参数 下 _SETILKW 说 明 若 必要 的 话 , 可 
以 等 待 其 他 的 进程 释放 锁 。 第 二 个 参数 指向 一 个 struct flock 类 型 的 变量 。 下 列 代码 为 一 个 
文件 描述 符 没 置 读数 据 锁 ; 


set read locktint fd) 
i 


struct flock lockinfo; 


lockinfo.l type = F RDLCK; /* a read lock on a region */ 
lockinfo.l pid = getpid(O; /* for ME «/ 

lockinfo.l start - 0; /* starting 0 bytes from.. */ 
lockinfo.l whence - SEEK SET; /* start of file x/ 
lockinfe.1_len = 0; /* extending until EOF */ 


fentl(fd,F SETLKW,&lockinfo); 


1 
t 


(25 她 何在 打开 的 文件 上 吉 写 数据 锁 ? 

使 用 fentl(fd.F SETLKW , &lockinfo) ,并 将 lockinfo. 1 type 置 F_ WRLCK。 

(3) 怎样 解锁 ? 

f& Fl fentl(id, F_SETLKW, &lockinfo? ,并 将 lockinfo. l type 置 F_UNLCK。 

(4) 如 何 只 锁 住 文件 的 一 部 分 ? 

使 用 fentl fd, F_SETLKW, & lockinfo) ,并 将 lockinfo. | start BAAR m EB. 
同时 将 lockinfo. ] ien 置 为 区 域 的 长 度 ， 

3. 基于 文件 的 时 间 服 务 器 代码 


/* file ts.c — read the current date/time from a file 
* usage. file ts filename 
* action; writes the current time/date to filename 
* note; uses fcntl() — based locking 


; 
Ey 


# include «i stdio. h> 
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# include  «sys/file. h> 
tfinclude  «fcntl.h-- 


# include «time. ho 
H define oops(m,x) | perror(m); exit(x); | 


main(int ac, char * av[ ]) 
1 

int fd; 

time t now; 


char * message; 


if (ac |» 201{ 


fprintf(stderr, "usage; file ts filename\n"); 


exit(1); 

} 

if ( tfd = open(av[1],O0 CREAT|O TRUNC|O WRONLY,0644) == -1)> 
oops(av[ 1],2); 

whiie(1) 

1 
timet Snow) ; 
message = ctime(&now); /* compute time x/ 
lock operation(fd, F WRLCK); /* lock for writing «/ 
if ( lseek(fd, OL, SEEK SET) == -1) 


oops("lseek" 3); 
if ( write(fd, message, strlen(message)) == -1) 


oops( "write", 4). 


lock operetion(fd, F_UNLCK); /* unlock file «/ 


sleep(1); /* wait for new time #/ 


lock_operation(int fd, int op) 
{ 
struct flock lock; 


lock. 1 whence = SEEK SET; 
lock.l start = lock.l len = 0; 
lack.l pid = getpid(; 

lock.l type = op; 


if ( fcntl(fd, F SETLKW, &lock) == -1) 


oops("lock operation", 6); 





第 15 半 进程 问 通 依 (IPC) 


479 











4， 基 于 文件 的 时 间 服 务 客 户 端 代码 


/* file tc.c - read the current date/time from a file 
* usage; file tc filename 
* uses; fentl() 一 based locking 


] 


x; 


4 include  «2stdio.h 
# include  «sys/file.h—- 
# include -fcntl. h— 


z define oops(m,x) | perror(m); exit(x); | 


# define BUFLEN 10 


main(int ac, char * avp]? 
i 


int fd, nread; 
char puf[ BUFLEN]; 


if Cac l= 23 
fprintf(stderr, “usage, file_tc filename\n"); 


exittl): 


if ( (fd= open(av[1],0 RDONLY)) == -1) 





oops(av( 17,3); 
lock operation(fd, F RDLCE); 


while( (nread = read(fd, buf, BUFLEN)) > 0 ) 


write(l, buf, nread ); 
lock operation(fd, F UNLCK); 


clese(fd; 


lock operation(int fd, int op) 


{ 


struct flock lock; 


lock. 1 whence = SEEK SET; 
lock. 1_ start = lock.l len = 0; 
lock, 1 pid = getpid(); 

lock.l type = op; 


if ( fentl(fd, F SETLEW, &lock) == -1) 


oops( "lock operation", 65; 
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5. ÈP: ab Be 

使 用 F_SETLKW 参数 调用 fentl 可 以 使 进程 挂 起 直到 内 核 多 许 进 程 设置 指定 的 锁 。 在 
读 取 数 据 之 前 ,客户 必须 设置 读 取 数据 的 锁 。 车 服务 髓 对 文件 加 写 数 据 锁 ,客户 只 好 等 待 服 
务 器 完成 。 服 务 器 在 重 写 数据 之 前 ,也 必须 对 文件 加 写 数据 锁 , 如果 这 时 客户 加 了 一 个 读数 
据 的 锁 , 那 服务 器 会 被 挂 起 直到 所 有 客户 释放 这 个 锁 。 

6. 重要 细节 : 进程 可 以 忽略 锁 机 制 

在 前 面 对 于 文件 锁 的 讨论 中 ,不 管 客户 还 是 服务 器 在 读 或 修改 文件 的 时 候 , 程 序 都 是 自 
觉 有 序 地 等 待 ,设置 及 释放 文件 锁 。 那 么 当 别 的 进程 设置 了 锁 的 时 息 , 其 他 进程 是 否 可 以 忽 
咯 它 ,仍旧 继续 原来 的 读 取 或 是 修改 操作 码 ? 管 案 是 肯定 的 。Unix 的 锁 机 制 允 许 进 程 通过 
这 种 方式 合作 ,但 并 不 强 扎 它们 一 定 要 用 。 


1$,4,2 信号 最 (Semapheres) 


在 基于 共享 内 存 段 技术 的 时 间 / 日 期 系统 中 ,共享 内 存 段 的 作用 与 基于 文件 系统 的 时 间 
/日 期 系统 中 的 文件 是 相同 的 。 前 面 介绍 了 用 锁 的 机 制 来 解决 访问 文件 的 冲 帘 ,共享 内 存 段 
如 何 来 避免 数据 冲突 呢 ? 在 共享 内 存 段 中 是 再 也 存在 着 读数 据 锁 和 写 数据 锁 的 概念 ”不 
是 ,但 进程 使 用 一 个 更 加 灵活 的 机 制 来 合作 : 信号 量 ， 

信 苇 量 大 一 个 内 核 变 量 , 它 可 以 被 系统 中 的 任何 进程 所 访问 。 进 程 间 可 以 使 用 这 个 变 
量 来 协调 对 于 共享 内 存 和 其 他 资源 的 访问 。 上 一 章 讨 论 了 如 何在 特定 的 情况 发 生 时 使 用 条 
件 变 量 来 通知 其 他 线程 。 条 件 对 象 是 进程 中 的 全 局 变量 ,而 信号 量 则 是 系统 中 的 全 局 变量 。 

在 时 间 ” 日 期 服务 器 和 客户 端 程 序 中 ,如 何 来 使 用 信号 旺 呢 ? 

1, 计数 器 及 其 操作 

在 无 客户 读 取 的 时 候 , 服务 器 将 数据 写 人 共享 内 存 段 中 。 同 样 地 ,在 服务 器 没有 对 共享 
内 存 段 进行 写 操作 的 时 候 , 窜 户 可 以 读 到 数据 。 可 以 将 这 些 规则 转换 为 关于 变量 值 的 表 
JAR: 

* 客户 端 等 待 吉 到 number of writers == 0 

， 服务 器 等 待 直 到 number of readers == 0 

信号 量 是 系统 级 的 全 局 变量 ,这 里 可 以 使 用 两 个 信号 量 分 别 代 表 读 者 数 和 写 者 数 。 管 
理 者 写 变量 需要 两 个 操作 。 ` 

举例 来 说 ,读者 必须 等 待 写 者 数 为 零 的 时 候 , 才 可 以 将 读者 数 加 1。 当 某 读者 读 完 数据 ， 
读者 数 必须 被 减 一 ， 

同样 地 , 写 者 也 必须 等 待 读者 数 为 零 的 有 时候, 才 可 以 将 写 考 数 加 1。 等 待 读者 数 为 零 以 
及 将 写 者 数 加 1 是 两 个 独立 的 操作 ,必须 分 开 执 行 , 即 这 两 个 操作 都 是 原子 操作 。 通 过 使 用 
信和 号 量 来 通信 的 进程 可 以 使 用 若干 个 这 样 的 变量 ,并 且 独 立地 进行 这 些 原 子 操作 。 

这 就 是 信号 量 机 制 的 工作 原理 。 进 程 可 以 同时 处 理 一 组 信号 量 上 的 多 个 操作 。 

2， 一 组 信号 量 、 多 个 活动 

时 间 服 务 器 系统 使 用 两 个 信号 量 , 如 图 15.8 所 示 , 并 且 读 者 和 窟 者 需 同 时 对 商 个 活动 集 
进行 操作 
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num rd num wrt 


图 15.8 信号 量 设置 : num readers, num. writers 


在 修改 共享 内 存 之 前 ,服务 器 必须 先 对 这 组 活动 集 进 行 操作 ， 
* [0] 等 候 num readers 变 成 0 

* [1] 将 num_writers 加 1 

当 服务 器 完成 写 操作 之 后 , 它 必 须 再 对 下 面 这 组 活动 集 进行 操作 : 
* [0] 将 num writers 减 1 

在 客户 读 取 共 享 内 存 之 前 ,必须 对 下 面 这 组 活动 集 进行 操作 ， 
* [0] 等 待 num writers 变 成 0 

* [1] 将 num_readers 加 1 

当 客 户 完成 任务 之 后 ,需要 对 下 面 这 组 活动 集 进行 操作 ， 

* [0] 将 num_readers 减 1 

3. 服务 器 版 本 : shm_ts2.c 

给 原来 的 程序 shm_ts. c 添加 信和 号 量 得 到 shm ts2. c; 


/* shm ts2.c — time server shared mem ver2 : use semaphores for locking 
* program uses shared memory with key 99 
* program uses semaphore set with key 9900 
x/ 


# include <stdio.h> 

# include <sys/shm. h> 

# include <time. h> 

# include <sys/types.h> 
# include <sys/sem.h> 
# include <signal.h> 


#define TIME_MEM_KEY 99 /* like a filename #/ 
#define TIME SEM KEY 9900 
f define SEG SIZE ((size t)100) /* size of segment */ 


#define oops(m,x) { perror(m); exit(x); } 


union semun ( int val ; struct semid ds * buf ; ushort x array; }; 


int seg id, semset id; /* global for cleanup() */ 


void cleanup(int); 
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main) 


{ 
char * wem plr, * chime(?; 
time t now; 


H 


int n; 


F 


/* create a shared memory segment x/ 


seg id = shmget( TIME MEM KEY, SEG SIZE, IPC CREAT|0777 ); 
if (seg id == -1} 
popsi "shmget", 1); 


/* attach to it and get a pointer to where it attaches «/ 


mem ptr = shmat( seg id, NULL, 0); 
if ( mem ptr == ( void *) -1) 
ocops("shmat", 2); 


/* create a semset, key 9900, 2 semaphores, and mode rw- rw- rw «/ 


semset id - semget( TIME SEM KEY, 2, 
(0666|IPC CREAT|IPC EXCL) 2; 
if ( semset id == -1) 


oops("semget", 35; 


set sem value( semset id, 0, 0); /* set counters */ 


set sem valuet semset id, 1, 0); /* both to zero x/ 
signal(SIGINT, cleanup); 


/* run for a minute #/ 
for {n= 0; n60; nt * J); 
timet &now } >; /* get the time »/ 
printf("Atshm ts2 waiting for lock\n"); 
wait and lock(semset id); /* lock memory «/ 


printf( "\tshm_ts2 updating memory\n"} ; 


strcpy (mem ptr, ctime(&now)): /* write to mem #/ 
sleep(5); 
release lock(semset id); /* unlock #/ 


printf("Atehm ts2 released lock\n"); 


Sleeptl); /* wait a sec #/ 


cleanup(0) ; 


void cleanup( int n) 
{ 
shmetl( seg id, IPC RMID, NULL; /* rm shrd mem «/ 





第 15 章 进程 间 通 信 (IPC) * 483 








semctl( semset id, 0, IPC RMID, NULL); /* rm sem set x/ 


fx 

* initialize a semaphore 

xf 
set sem value(int semset id, int semnum, int val) 
1 


union semun initval; 


initval. val = val; . 
if ¢ semctl(semset id, semnum, SETVAL, initval) == -1) 
oops("semctl", 4); 


} 


f 


i* 


* build and execute a 2 — element action set, 
* wait for 0 on n readers AND increment n writers 
, 


*/ 


wait and lock( int semset id } 


1 
struct sembuf actions[2!; /* action set +/ 
actions[0].sem mum = 0; fs Sem Q0! is n readers «/ 
actions[0].sem flg = SEM UNDO; /* auto cleanup x/ 
actiong[0|.sem op = Ù; /* wait til no readers x/ 
actions[1].sem num = 1; : /* sem 1] is n writers «/ 
actions[1].sem flg = SEM UNDO; /* auto cleanup «/ 
actians|1l.sem op = +1; /* incr num writers */ 
if ( semop( semset id, actions, 2) == —1) 


oops("semop, locking", 10); 


fe 

* build and execute a 1 - element action set. 
* decrement num writers 

xf 


release_lock( int semset_id ) 


1 - 


struct sembuf actions[1]; /* action set */ 
actions[Ü'.sem num = i; /* sem 0; is n writerS »/ 
actions[0].sem flg = SEM UNDO; /* auto cleanup */ 
actions[0].sem op = -1; fs decr writer count */ 
if ( semop( semset id, actions, 1) == -1) 


oops("semop; unlocking”, 105; 
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此 程序 中 ,使 用 信号 量 集 的 服务 器 必须 完成 下 面 的 5 个 步 又 。 

(D 创建 信号 其 集 

semset id = semget(key ! key, int numsems, int flags) 

semget BK E GI SE T — TEE numsems 个 信号 最 的 集合 。shm_ ts 程序 创建 包含 两 个 
(SEROMA RMSE 0666, UC semget 返回 此 信号 量 集 的 1D。 

(2) 将 所 有 的 信和 号 量 置 0 

semctl(int semset id, int semnum, int cmd, union semun arg) 

这 里 使 用 semal 来 对 信和 号 量 集 进行 控制 。 此 函数 的 第 一 个 参数 是 此 集合 的 ID, 第 二 个 
参数 是 集合 中 某 特定 信号 量 的 号 码 , 第 三 个 参数 是 控制 命令 。 如 果 此 控制 命令 需要 参数 , 那 
么 使 用 第 四 个 参数 向 其 提供 所 需 的 参数 。 在 shm_ts2 中 ,使 用 SETVAL 命令 来 给 每 一 个 信 
号 量 赋 一 个 初 值 零 。 l . 

(3) 等 待 所 有 读者 完成 任务 之 后 ,服务 器 将 num_writers 加 1 

semop(int semid, struct sembuf * actions, size t numactions) 

PREX semop 对 信和 号 量 集 完成 一 组 操作 。 第 一 个 参数 用 来 指定 信号 量 集 。 第 二 个 参数 是 
一 组 活动 的 数组 。 最 后 一 个 参数 则 是 该 数组 的 大 小 。 集 合 中 的 每 一 个 活动 都 是 一 个 结构 
体 , 它 的 作用 就 是 “使 用 选项 sem_flg 来 完成 对 号 码 为 sem_num 的 信号 量 的 操作 sem. op", 
整个 活动 集合 被 作为 组 来 完成 ,这 一 点 是 关键 。 上 面 程序 中 的 函数 wait and lock 完成 两 个 
操作 : 等 待 读者 数 到 零 ,然后 将 写 者 数 加 1. 这 里 建 了 一 个 包含 这 两 个 活动 的 数组 。 活 动 0 
所 要 完成 的 事情 就 是 "等 待 信号 量 0 变 成 0”。 而 活动 1 要 完成 的 功能 则 是 * 将 信号 量 1 加 
1”。 进 程 挂 起 直到 这 两 个 活动 都 被 完成 。 只 要 读者 计数 器 一 变 成 0, 写 者 计数 器 立即 加 1, 然 
后 semop PR [nl , | l 

使 用 SEM UNDO $R d FPF Al AE E IB HEB A RR ROE. YE E EX TURUE 
p, 当 写 者 计数 器 被 加 1 89] A JESE PB PB E RS. 如 果 在 对 此 计数 器 黎 减 1 操作 之 
前 ,进程 非法 终止 ,其 他 进程 则 永远 无 法 读 取 共 享 内 存 段 的 内 容 了 。 

(4) Xf num writers BS 1 

在 release lock 函数 中 ,只 需 完成 一 件 事情 ; 对 写 者 数 减 1。 这 里 使 用 一 个 只 包含 该 活 
动 的 数组 作为 参数 来 调用 semop 函数 ,从 而 完成 对 写 者 数目 的 修改 。 如 果 这 时 某 客户 正在 
等 待 , 它 立即 就 可 以 继续 执行 读 操 作 了 。 

(5) 删除 信号 量 

semctl(semset_id, 0, IPC RMID, 0) 

任务 完成 之 后 ,服务 器 再 次 调用 semet] 函数 ,不 过 这 次 的 目的 是 删除 信和 号 量 。 

4. SPH. shm tc2.c 

客户 端的 设计 相对 容易 得 多。 在 程序 shm_tc 中 , 既 不 初始 化 信号 量 也 不 删除 它们 。 








/* shm tc2.c — time client shared mem ver2 , use semaphores for locking 
* program uses shared memory with key 99 
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* program uses semaphore set with key 9900 


] 


f include  «stdio.h-» 
# include  «sys/shm, h> 
# include «time. K> 


d include «l sys/ types. b> 


X include <Csys/ipc. ho 


# include  «sys/sem.hc 


#define TIME MEM KEY 99 /* kind of like a port number x/ 
H define TIME SEM KEY 9900 /* like a filename x/ 
# define SEG SIZE U(size_t)100) /* size of segment x/ 


# define oops(m,x) { perror(m); exit(x); } 


union semun | int val ; struct semid_ds * buf ; ushort * array; }; 


main() 


{ 


int seg id; 
char «mem ptr, * ctime(); 


long now; 
int  semset id; /* id for semaphore set «/ 
/* create a shared memory segment «/ 


seg id = shmget( TIME MEM KEY, SEG SIZE, 0777 ); 
if( seg id == -1} 
oops("shmget",1); 


/* attach to it and get a pointer to where it attaches »/ 


mem ptr = shmat( seq id, NULL, 0 5; 
if ( mem ptr == ( void +=) >19) 
oops( "shmat",2); 


/* connect to semaphore set 9900 with 2 semaphores +/ 


semset id - semget( TIME SEM KEY, 2, 0); 
wait and lock( semset id }; 


printf("The time, direct from memory; .. $a", mem ptr); 


release lock( semset id); 
shmdt( mem ptr >; /* detach, but not needed here x/ 


fx 


* build and execute a 2 — element action set. 
* wait for 0 on n writers AND increment n readers 


x/ 
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wait and lock( int semset_id ) 


了 
1 


union semun sem info; /* some properties x/ 
struct sembuf actions[2]; /* action set x/ 
actions[0].sem num = 1; /* gem[ 1] is n writers #/ 
actions[0:.sem flg = SEM UNDO; /* auto cleanup x/ 
actions[0].sem op = 0; /* wait for 0 x/ 
actions[1].sem num = 0; /* sem| 0| is n readers +/ 
actions[1].sem flg - SEM UNDO; /* auto cleanup */ 
actions[1].sem op = *1; /* incr n readers x/ 

if € semop( semset id, actions, 2) == —1) 


oops("semop, locking", 10}; 


} 


/* 


* build and execute a 1 — element action set, 
* decrement num readers 
af 


release lock( int semset id ) 


{ 


union semun sem info; - /* some properties x, 
struct sembuf actions[1]; /* action set */ 
actions] 0 |.sem_num = 0; /* sem[0] is n readers «/ 
actions[0,.sem flg = SEM UNDO; /* auto cleanup x*/ 
actions[0].sem op = -1; /* decr reader count +/ 


if ( semopt semset id, actions, 1) == -1) 


oops("semop; unlocking’, 10}; 


编译 并 对 程序 做 如 下 的 测试 ， 


5 cc shn_ts2.c - o shnserv 

5 cc shm tc2.c - o shnclnt 

& ./shnserw& 

[1j 15533 
shm ts2 waiting for lock 
ghm_ts2 updating memory 
shm ts2 released lock 
shm_ts2 waiting for lock 
shm ts2 updating memory 

5 ./shnclnt 

shm ts2 released lock 

The time, direct from memory; .. Sat Oct 27 17,36,34 2001 

s shm ts2 waiting for lock 
shm ts2 updating memory 
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号 ./shmcint 

shn ts2 released lock 
The time, direct from memory; ..Sat Oct 27 17.36,40 2001 
5 shm_ts2 waiting for lock 


-一 一 一 一 = Shared Memory Segments -—------- 
key shmid owner perms bytes nattch status 
Ox00000063 30670854 bruce 177 100 i 

z: =-->- Semaphore Arrays -- -----—- 
key shmid owner perms  nsems status 
Ox000026ac 262146 bruce 666 2 

“一 一 一 一 一 Message Queues 一 一 一 一 一 一 


key msgid owner perms used- bytes messages 


$ shm_ts2 released lock 
shm_ts2 waiting for lock 
§ kill - IN? 15533 


$ semop; unlocking, Invalid argument 


上 面 对 程 序 的 测试 展示 了 客户 端 如 何等 待 服务 器 解锁 。 许 包容 户 可 以 同时 运行 ,每 一 
客户 等 待 服务 器 计数 器 变化 到 0, 然后 对 客户 计数 器 加 1]。 和 如果 三 个 客户 同时 从 共享 内 存 中 
RAE ,读者 计数 器 也 将 是 三 个 。 服 务 器 只 好 等 三 个 客户 的 读者 计数 器 都 变 为 0 时 , 才 可 
以 进行 数据 的 写 操 作 .。 

程序 中 并 没有 对 可 能 出 更 的 所 有 情况 进行 处 理 。 具 体 来 说 ,如 何 防止 两 个 服务 器 程序 
间 时 运行 ? 在 我 们 的 程序 中 ,服务 器 仅仅 等 待 客户 的 读者 服务 器 变 为 0 而 并 没有 对 其 他 服务 
器 的 写 者 计数 器 进行 判断 。 

5. d XL GE EG ard 

dr Pm 5g GEB HRCOT RWS 31 f 70 d EOS E IRL EST S R RARP RRES 
变 为 零 。 E EMI RUE rh d vp RARE EGRE ESETRE. SAK HEE 
望 等待 信 号 量 的 值 变 为 2。 如 何 来 写 这 样 的 程序 呢 ? 

这 里 使 用 一 个 不 太 直接 的 方法 : 让 系统 内 核对 信号 量 做 减 2 操作 。 信 号 量 不 介 许 为 负 
值 ,因此 系统 内 核 将 调用 挂 起 直到 信号 量 的 值 大 于 或 等 于 2。 信和 号 量 一 且 达 到 2, 某 进 程 就 对 
它 做 减 2 操作 ,然后 把 任何 其 他 要 对 这 个 信号 量 减 2 的 进程 挂 起 。 

这 个 操作 的 sem op 成 员工 作 方 式 如 下 。 

* @ sem op 是 正 值 ,活动 : 通过 sem op RHF SBM 2. 

* d sem op 是 霉 ,活动 : 挂 起 直到 信号 量 等 于 0. 

* # sem op EM ia. 挂 起 直到 信和 号 量变 成 止 值 。 


15.4.3 socket 及 FIFO 与 共享 的 存储 


本 章 的 前 面部 分 号 了 四 个 版 本 的 时 间 / 日 期 服务 器 和 客户 端 穆 序 。socket 版 本 和 FIFO 
版 本 要 相对 容易 些 。 客 户 端 连接 到 服务 器 ,服务 器 发 送 数据 ,然后 服务 器 进程 挂 起 。 虽 然 共 
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享 内 存 和 文件 的 版 本 看 上 去 很 简单 ,但 它们 需要 锁 和 信号 量 机 制 来 保护 数据 。 要 知道 加 入 
锁 和 信号 量 也 是 相当 复杂 的 一 件 事 。 

然而 文件 和 共享 内 存 机 制 允 许多 客户 端 同 时 从 服务 器 读 取 数据 ,人 允许 客户 端 和 服务 器 
在 不 同 的 时 刻 运 行 ,并 且 当 进程 崩溃 时 , 允许 数据 的 保持 和 恢复 。 

管道 和 socket 也 包含 了 锁 的 机 制 。 管 道 和 socket 其 实 也 是 保存 数据 的 内 存 段 , 它 将 数 
据 从 源 端 复制 到 目的 端 。 不 同 的 是 管道 和 socket 中 的 锁 和 信号 量 是 由 内 核 ,而 不 是 由 进程 
来 管理 的 。 


15.5 打 Fl 池 


在 时 间 / 日 期 程序 中 ,服务 器 发 数据 给 客户 端 。 然而 另外 的 一 些 程序 却 是 以 截然 不 同 的 
方式 工作 : 多 客户 端 发 数据 给 服务 器 ,例如 打印 服务 器 上 的 打印 池 。 那么 这 种 类 型 的 程序 如 
何 来 设计 呢 ? 

15.5.1 多 个 写 者 、 一 个 读者 

如 图 15. 9 所 示 ,多 用 户 共 享 一 个 打印 机 。 如 何 使 用 客户 端 / 服 务 器 模型 来 设计 一 个 共享 

打印 机 的 程序 呢 ? 多 个 用 户 可 能 会 在 同时 发 送 打印 请 求 ,但 是 打印 机 在 某 一 时 刻 只 能 打印 


一 个 文件 。 打 印 程序 就 必须 接收 多 个 并 发 的 输入 ,并 将 单个 的 输出 流 送 到 打印 设备 上 。 如 
何 来 写 这 个 服务 器 程序 呢 ? 它们 之 间 又 如 何 通信 呢 ? 





一 个 打印 机 。 ”打印 机 任务 队列 一些 同步 的 打印 机 请 求 
图 15.9 多 个 数据 源 .一 个 打印 机 


这 个 程序 由 哪些 功能 单元 组 成 ? 这 些 单元 之 间 又 传递 哪些 数据 和 消息 呢 ? 





printer 







file O 
图 15.10 将 一 个 文件 传 给 打印 机 
在 Unix 系统 中 打印 文件 的 最 简单 方法 就 是 使 用 如 下 命令 ， 


cat filename > /dev/lpl 或 者 cp filename /dev/1p1 
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这 里 /dev/lpl 是 打印 机 设备 文件 的 名 称 。 当 然 系统 中 打印 设备 文件 名 称 并 不 一 定 和 上 
面 的 一 样 , 但 在 Unix 系统 中 将 数据 传 给 打印 机 或 其 他 设备 的 惟一 方法 就 是 通过 open 打开 
文件 ,然后 使 用 write 系统 调用 将 数据 写 至 打印 文件 中 。 

可 以 使 用 写 数据 锁 吗 ? 

大 家 已 经 学 习 过 写 数据 锁 和 信号 量 机 制 了 。 为 什么 不 可 以 自己 写 一 个 cat 或 cp 的 打印 
程序 ,让 它 通 过 写 数据 锁 来 防止 对 设备 文件 的 同步 访问 冲突 呢 ? 

基于 锁 机 制 的 文件 复制 程序 确实 没有 问题 。 考 虑 一 下 对 打印 机 加 锁 后 ,结果 会 怎样 。 
若 某 程序 对 打印 机 加 锁 , 其 他 的 文件 复制 程序 都 必须 挂 起 等 待 第 一 个 程序 完成 任务 并 释放 
锁 。 那 么 下 一 步 哪 个 程序 执行 呢 ? 内 核 将 所 有 挂 起 进程 中 的 一 个 唤醒 ,但 是 这 个 进程 却 不 
一 定 就 是 排 在 第 二 的 。 显 然 这 样 的 决定 有 失 公平 。 允 许 用 户 通过 复制 数据 到 打印 设备 文件 
来 实现 打印 还 有 另 一 个 问题 : 若 有 些 人 试图 作假 ,他 们 可 以 不 使 用 这 样 一 个 加 锁 的 程序 来 打 
印 。 第 三 个 问题 则 是 某 些 文件 需要 特殊 的 处 理 。 例 如 图 像 文件 有 可 能 需要 被 转换 为 打印 机 
可 以 看 得 懂 的 图 像 命令 。 很 多 用 户 并 不 知道 如 何 将 数据 转换 成 通用 的 格式 ,那么 他 们 就 得 
不 到 正确 的 结果 。 然 而 这 所 有 的 问题 都 可 以 由 集中 化 (客户 /服务 器 模式 ) 来 解决 。 


15.5.2 客户 /服务 器 模型 


程序 的 客户 /服务 器 模型 解决 了 前 面 提 到 过 的 打印 的 问题 。 只 有 一 种 称 为 线性 打印 精 
R (line printer daemon) 的 服务 器 程序 有 权限 去 写 数据 到 打印 设备 文件 中 ,而 其 他 的 用 户 进 
程 则 不 行 (如 图 15. 11 所 示 ) 。 当 用 户 需 要 打印 文件 的 时 候 , 他 们 运行 一 个 称 为 lpr 的 客户 端 
程序 。lpr 对 文件 做 了 一 个 复制 ,然后 将 复制 的 文件 放 在 打印 任务 队列 中 。 用 户 可 以 删除 或 
编辑 这 个 文件 。 并 且 打 印 精灵 程序 可 以 将 图 片 和 格式 做 转换 以 使 得 它们 能 够 正确 地 被 打印 
出 来 。 





图 15.11 客户 /服务 器 模型 的 打印 系统 


客户 端 和 服务 器 如 何 通信 呢 ? 它们 交互 哪些 数据 ? 客户 端 将 整个 文件 传 给 服务 器 还 是 
客户 端 仅仅 将 文件 名 传 给 服务 器 呢 ? 如 果 服 务 器 和 客户 不 是 在 同一 台 机 器 上 ,情况 又 将 如 
何 ” 这 是 否 影响 到 对 通信 方式 的 选择 呢 ? 不 同 版 本 的 Unix 中 有 不 同 的 打印 系统 : 有 些 使 用 
socket, 有 些 使 用 命名 管道 ,而 另外 一 些 仅 使 用 fork 和 文件 。 

是 否 使 用 集中 化 的 客户 /服务 器 模式 就 可 以 不 使 用 锁 机 制 来 避免 冲突 了 ? 可 以 把 系统 
设计 成 一 个 通过 构件 进行 通信 和 合作 的 模型 来 打印 一 台 机 器 上 的 文件 ,也 可 以 用 来 打印 
Internet 上 的 文件 。 可 以 将 你 自己 的 思路 和 不 同 版 本 的 Unix 打印 系统 的 设计 思路 做 一 个 
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比较 。 
15.6 纵 观 IPC 


本 章 书 经 介绍 过 各 种 形式 的 进程 间 盘 信 方 法 。 下 面 是 一 个 小 缚 。 










































































是 否 可 以 使 用 在 不 同 的 进程 
方 法 类 型 | 是 否 可 以 使 不 同 的 线程 
不 同 机 器 上 P/C Sib | Unrel 
exec/ wait M * 
t+ | L 
environ M s 
pipe | 3 * Q* x 
kill-signal M x * x 
inet socket 5 l x ? 7 ? 7 
inet. socket M * | ? | 7 (7 ? 
Unix socket. 3 ? ? ; * ? 
Unix socket M ? ? * | 7 
named pipe — 5 i ? ? x ? j 
shared mem | R F x x x ? 
msg queue M x [ x * x 
files R N x x * ? - 
variables | M D * 
file locks C N * n * x + 
semaphores C x x x ? 
mutexes | Cc l n . 
. LL. . —. - 4 . - 
link C * * * 7 
一 一 一 -上 Áo LLL 
LESANE 
P/C— ETHE 
Sib — -PXE 
inrer -AXIE 
M- 一 发 送 消 息 
S— i FE ge SIS PT BE 
RR 一 一 随机 读 取 数据 
C—- -用 来 使 任务 同步 或 合作 
»— -适当 的 应 用 


? 一 -不 适当 的 应 用 
N- -一 适 台 席 用 在 网络 文 忻 系统 上 


上 面 的 这 张 表 并 不 包含 贝尔 实验 室 的 网 络 工具 TLI 以 及 它 的 后 续 产 品 。 
解释 如 下 : 


* fork- execv- argv.exit- wait 
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用 于 使 用 一 组 参数 来 调用 某 个 程序 ,被 调用 也 数 将 一 个 整 型 值 返回 给 其 调用 者 。 父 进 
程 道 过 和 使用 fork 来 创建 一 个 新 的 进程 ,在 此 新 进程 中 的 程序 可 以 通过 调用 execv 来 运行 新 
的 程序 ,并 传递 给 新 程序 一 组 参数 。 子 进 穆 通 过 使 用 exit 传 回 一 个 返回 和 值 , 同 时 父 进 程 使 用 
wait 3k fili 3x TK [oT (B. 

iX — £H Và Hj f nig [81 BH "EL ATL UDCRT DL 8 FE TE RR ORBI ERE IP. BARE TELLE GEH. 

* environ 

系统 调用 exec 通过 一 -个 叫做 environ HAAS E E BE ES SIUE IHE REB SEE ER RR 
FP. HERTHA TE IST HERR. ECT EUH TREE LAT ERE ERE HA CE? 

此 方法 也 旦 面向 对 象 的 , 单 向 的 ,仅仅 可 以 使 用 在 相关 的 进程 中 , 且 只 能 在 单机 上 使 用 。 

* pipe 

管道 是 由 进程 创建 的 单 向 数据 流 。 它 包含 连接 到 内 核 FE 的 文件 措 述 符 。 写 进 一 个 文件 
描述 符 的 数据 可 以 从 另 一 个 文件 描述 符 读 出 来 。 如 果 进 程 在 创建 管道 之 后 调用 了 fork, BA 
新 的 进程 就 可 以 通过 同样 的 管道 该 所 数据 。 

此 方法 是 面向 流 的 ,通常 为 单 同 传 输 , 也 仅仅 可 以 使 用 在 相关 的 进程 中 ,上 且 只 能 在 单机 
上 使 用 。 

* kill-signal 

信号 (signalD) 是 一 条 从 一 个 进程 发 往 另 一 个 进程 的 整 型 消息 (使 用 kil 系统 调用 )。 接 收 进 
程 可 以 通过 使 用 signal 系统 调用 来 安排 一 个 处 理 者 函数 ,此 函数 在 信和 叶 到 来 的 时 候 被 调用 ， 

此 方法 是 面向 消息 的 , 革 -- 时 刻 单 向 的 ,进程 必须 拥有 相同 的 用 户 ID, 旦 只 能 在 单机 上 
使 用 。 

* [nternet sockets 

Internet sockets 是 这 样 一 条 链接 , 它 的 两 个 端点 是 通过 特定 的 端口 导 建立 起 来 的 。 字 
节 流 道 过 socket 进行 传输 ,从 -个 进程 到 达 男 一 个 进程 ,类 似 于 某 人 在 波士顿 打 电 话 给 在 东 
MATH AC. Internet sockets 有 两 种 主要 的 实现 方式 ; Bl socket MBE socket, xxu 
可 以 双向 传输 。 辣 socket 更 类 似 于 文件 描述 符 : 程序 员 使 用 write 和 read 调用 来 发 送 和 接 
收 数 据 。 数 据 报 socket 则 类 伺 于 明信片 : 写 者 将 缓存 中 的 一 块 数据 发 给 读者 。 所 有 的 交互 
郁 是 以 数据 缓存 的 形式 完成 ,市 不 是 字 节 流 ，。 

有 面向 消息 和 面向 流 两 个 版 本 ,双向 传输 ,可 以 在 无 关 进 程 中 使 用 ,可 以 通过 网 络 传输 
数据 。 

* Named Sockets 

命名 socket, XER Unix 域 socket。 它 使 用 文件 名 作为 地 址 而 不 是 主机 名 一 端口 号 对 ， 
命名 socket 同时 支持 流 和 数据 报 版 本 。 因 为 这 种 方式 使 用 文件 名 而 不 是 主机 一 端口 作为 地 
hb. ie EHET UE ESSI ELSE EERE 

这 种 方法 有 而 向 消息 和 面向 流 两 个 版 本 ,双向 传输 ,可 以 在 无 闫 进程 中 使 用 ;只 能 工作 
Tr SEIL E 
* Named Pipes( FIFOs) 
命名 管道 的 工作 方式 类 似 于 一 个 常规 管道 ,但 是 它 可 以 连接 两 个 无 关 的 进程 。 命 名 管 
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道 由 文件 名 来 标志 。 写 者 使 用 open 调用 来 打开 文件 并 写 数据 ,读者 同样 使 用 open 调用 打开 
文件 读数 据 。 这 种 方法 比 命名 socket 使 用 起 来 方便 很 多 ,但 是 它 只 可 以 单 向 传输 。 

此 方法 是 单 向 传输 的 .面向 流 的 ,可 以 连接 无 关 进 程 , 只 能 工作 在 单机 上 。 

* File Locks 

Unix 允许 进程 对 文件 的 访 癌 设置 锁 。 进 程 可 以 对 文件 的 某 一 段 如 锁 ,使 自己 可 以 单独 
地 对 这 一 段 进行 改动 。 另 一 个 试图 锁 住 此 文件 的 进程 将 被 挂 起 ,直到 这 个 文件 被 解锁 。 文 
件 锁 机 制 允许 进程 闻 进 行 通信 ,让 所 有 的 进程 都 知道 是 哪 一 个 进程 正在 读 取 或 修改 文件 。 
这 里 可 以 使 用 系统 调用 flock, lockf 和 fentl 来 设置 或 测试 文件 锁 ， 在 某 些 系统 中 ,这 些 锁 是 
被 强制 加 上 的 。 . 

这 种 方法 面向 消息 ,多 个 无 关 进 程 间 可 以 同时 交互 ,但 只 能 在 单机 上 工作 。 

* Shared Memory 

每 个 进程 都 有 其 自己 的 数据 空间 。 程 序 所 定义 的 任何 变量 或 在 运行 时 刻 分 配 的 空间 者 
只 有 对 该 进程 是 可 见 的 。 进 程 可 以 通过 使 用 shmget 和 shmat 调用 来 创建 可 以 被 多 个 进程 
共享 的 内 存 段 。 由 一 个 进程 写 人 共享 内 存 段 的 数据 可 以 被 别 的 对 此 内 存 段 有 访问 权 限 的 进 
程 读 出 。 这 是 IPC 中 最 为 有 效 的 一 个 方法 ,因为 所 有 的 通信 并 不 需要 数据 的 传输 。 

此 方法 面向 随机 访问 ,多 个 无 关 进 程 间 可 以 同时 交互 ,但 只 能 在 单机 上 工作 ， 

* Semaphores 

信号 量 是 系统 级 的 变量 ,程序 之 间 可 以 通过 信号 量 来 进行 通信 。 进 程 可 以 对 信号 量 做 
增 1 操作, 减 1 操作 或 等 待 信号 量 到 某 个 特定 的 值 ,信和 号 量 类 似 于 许可 证 服务 器 上 的 许可 
证 。 当 进程 需要 使 用 资源 的 时 候 , 它 对 信号 量 做 减 1 操作 (到 一 个 许可 证 )。 如 果 此 时 许可 证 
已 经 内 完了 ,进程 挂 起 直到 其 他 进程 对 信号 量 做 了 增 1 操作 。 信 号 量 应 用 在 各 种 各 样 的 程 
序 中 。 

此 方法 是 面向 消息 的 ,多 个 无 关 进 程 间 可 以 同时 交互 ,但 只 能 在 单机 上 汗 作 。 

* Message Queues 

消息 队列 的 工作 原理 类 似 于 FIFO, 但 它 并 不 是 以 文件 名 来 标志 。 进 程 可 以 将 消息 加 到 
队列 中 ,然后 由 其 他 进程 将 数据 从 队列 中 取出 。 多 个 队列 可 以 被 多 个 进程 所 共享 。 

这 种 方法 是 面向 消息 的 . 单 向 传输 的 , 且 只 能 工作 在 单机 上 

* Files 

AU RT LUE PER ERAT. DURO EROR EA. CES BOER 
可 以 从 该 文件 中 读 出 数据 。 若 大 家 都 使 用 一 个 经 过 巧妙 设计 的 交互 协议 ,很 多 复杂 的 通信 
都 可 以 通过 证 老 的 文件 机 制 来 实现 。 

此 方法 面向 随机 访问 , 窗 个 无 关 进 程 间 可 以 同时 交互 ,网 络 文 件 系 统 CNFS) 可 以 支持 跨 
机 器 的 多 进程 通信 。 


15.7 连接 与 游戏 


本 章 介绍 了 很 多 进程 之 间 传 递 数 据 的 方法 。Umnix 的 系统 内 核 管理 着 进程 .文件 和 设备 ， 
并 且 对 管道 ,socket ,文件 .共享 内 存 以 及 信和 号 进行 操作 使 它们 可 以 传输 数据 。 对 于 某 些 程序 
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来 说 ,创建 和 管理 连接 与 数据 的 传输 是 最 主要 的 部 分 。 
Unix 的 开发 者 之 一 Ken Thompson; 在 1978 年 写 道 : 
“与 其 说 Unix 的 内 核 是 一 个 完整 的 操作 系统 ,还 不 如 说 它 是 个 IO SBR AS 

(multiplexer) 。 从 这 种 观点 出 发 ,许多 其 他 操作 系统 中 的 特征 在 Unix 内 核 中 是 找 不 到 的 

ern 4 SHORE HP EAA FE SC 89 , 0" 

在 第 1 章 中 ,讨论 了 命令 bc. 一 个 Web RFBRA-THSHEBK. RASTI 

be Farr ABI + Web 服务 器 程序 。 那 么 如 何 写 网 络 桥牌 游戏 呢 ? 可 以 使 用 屏幕 控制 程序 来 

作为 用 户 界面 ,使 用 socket 来 连接 两 端 。 那 么 哪 一 端 是 服务 器 ? 哪 一 端 是 客户 呢 ? 如 何 使 

用 和 镇 机 制 ? 你 所 需要 的 所 有 的 技术 都 包含 在 本 书 的 章节 中 。 在 Unix 土 进行 编程 并 没有 想 

象 中 的 那么 难 , 可 是 也 并 非 是 一 件 容 易 的 事 。 

说 到 游戏 和 网 络 ,让 我 们 回忆 一 下 Dennis Ritchie 是 如 何 来 描述 用 来 引 出 Unix 的 空间 
探险 游戏 的 : 
“最 开始 写 在 Multies 系统 上 …… ,这 并 不 亚 于 对 太阳 系 诸 星体 运动 的 模拟 。 你 还 必须 

让 玩家 名 驶 着 太 室 船上 四 处 近视 ,观看 空间 的 景色 并 且 可 能 在 行星 或 其 卫星 上 登录 。” 
驾驶 着 太空 船 四 处 巡视 ,观看 空间 的 景色 并 且 可 能 在 行星 或 其 卫星 上 登录 不 就 像 生活 

中 的 网 络 冲浪 一 样 吗 ? 可 能 冲浪 并 不 是 最 好 的 比喻 。 但 是 确实 人 们 打开 他 们 的 浏览 器 ,到 

全 世界 四 处 训 览 , Web 服务 器 将 各 处 的 景象 返回 。 人 人们 使 用 telnet.ssh 还 有 ftp 登录 到 其 他 

机 器 上 上。 也许 Internet 恰巧 就 是 Ritchie fl Thompson 在 1969 年 开始 模拟 的 广阔 空间 的 实 

BENE t 


小 结 


1, 主要 内 容 

许多 程序 都 包含 一 个 或 多 个 进程 ,进程 间 通 过 共享 数据 或 传递 数据 进行 通信 。 举 例 
来 说 ,了 蝴 个 人 通过 使 用 Unix 的 talk 命令 进行 对 话 , 他 们 就 运行 了 黄 个 进程 ,将 数据 
从 键盘 和 socket 传输 到 屏幕 和 socket, 

茶 些 进程 需要 从 多 个 源 端 接收 数据 ,并 将 数据 送 到 多 个 目的 地 。seiect 和 poll 调用 多 
许 进程 等 待 多 个 文件 描述 符 的 输入 。 

Unix 提供 了 许多 方法 来 进行 数据 在 进程 间 传 输 。 命 名 管道 和 共享 内 存 是 同一 机 器 
上 的 进程 间 通信 使 用 的 两 种 技术 。 通 信 方 法 的 区 别 在 于 它们 的 速度 、 所 传输 的 消息 
类 型 ,所 需 的 范围 .限制 访问 权限 的 能 力 以 及 防止 数据 冲突 的 能 力 ， 

文件 锁 是 进程 间 使 用 的 避免 对 文件 访问 冲突 的 技术 。 

信号 量 是 进程 合作 时 所 使 用 的 系统 级 的 变量 。 进 程 挂 起 等 待 另 一 一 进程 改变 信 5H 
I fü 

2. 'F—3b MEA 

学 习 Unix 系统 编程 的 最 好 的 办 法 就 是 不 断 的 读 程 序 , 写 程序 。 大 家 可 以 在 网 上 找到 大 


* 
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:以 及 介绍 Unix 内 部 实现 和 编程 接口 的 书籍 。 大 家 多 注意 一 下 每 天 都 使 用 的 程序 


还 有 一 些 晨 引 你 的 新 程序 。 通 过 使 用 .学 习 ,. 并 且 经 常 自 己 来 实现 一 些 已 经 存在 的 程序 ,就 
可 以 更 深 、 更 精 、 更 广泛 地 了 解 Unix 的 编程 了 。 
3. 习题 


15.1 


在 talk 程序 中 ,为 何不 用 线程 从 文件 描述 符 中 读 取 数据 呢 ? — RT UL BUE 
盘 该 最 数据 ,而 另 一 线程 从 socket 读 取 数 据 。 车程 序 由 多 线程 方案 来 实现 ,会 出 
现 哪些 新 间 题 呢 ? 








15.2 talk 程序 在 大 多 数 的 时 候 都 是 在 读 写 单个 字符 ,但 在 传输 数据 的 时 候 合用 的 是 数 
En. EHAR socket B ok RSH A? 

15.3 基于 FIFO 的 时 间 服 务 器 在 执行 到 date > /tmp/time fifo 的 时 候 挂 起 直到 某 一 
客户 端 打开 FIFO 来 读 取 数据 。 蔡 服务 器 挂 起 的 时 间 很 长 ,客户 端 是 在 服务 器 挂 
起 时 能 够 接收 到 时 间 还 是 在 服务 器 被 蜡 醒 的 时 候 能 接收 到 时 间 ? 为 什么 ? 

15.4 看 一 下 系统 调用 mmap. mmap 将 文件 的 某 一 段 模拟 成 内 存 中 的 一 个 数组 ,从 而 
允许 程序 不 使 用 Iseek 就 可 以 对 文件 进行 随机 的 访问 。 使 用 mmap 与 使 用 文件 
或 共享 内 存 的 方式 来 实现 进程 间 通 信 有 何 区 别 ? 和 别 的 方法 相 比 ,使 用 mmap 
LARS 

15.5 talk 中 包含 了 两 个 相连 的 进程 。 使 用 :一 下 taik, 看 一 看 连接 是 如 何 建 立 的 ? 其 中 
LEA TEEF? 

4. 编程 练习 

15.6 参考 sclect 和 poll 调用 的 使 用 手册 ,看 看 你 的 系统 中 是 否 都 支持 。 frd e NE 
中 ,其 中 一 个 是 真 的 系统 调用 ,而 另外 一 个 则 是 由 那个 真 的 系统 调用 模拟 出 来 
的 。 使 用 poll 来 重 写 程 序 selectdemo. c. 

15.7 编写 使 用 下 列 方法 的 时 间 / 日 期 服务 器 和 客户 端 程序 。 
(1) 使 用 I 地 扯 的 数据 氢 socket, 
《2) 使 用 Unix 域 地 址 的 流 socket, 

15.8 编写 基于 FIFO 的 时 间 / 只 期 服务 器 积 客 户 端 程序 ， 

15.9 多 个 共享 内 存 的 服务 器 : 


CD 可 雇 存 同一 时 刻 运 行 两 个 共享 内 存 的 服务 器 吗 ?” 汶 什么 ?做 一 下 试验 。 
(2) 修改 服务 器 程序 中 的 wait_and_lock 函数 ， 使 服务 器 可 以 挂 起 等 待 直到 运行 
的 服务 器 数 且 变 为 0。 


15. 10 ”在 使 用 文件 的 版 本 中 ,用 文件 锁 来 保护 对 共享 文件 的 访问 。 重 写 此 程序 ,用 信 


15. 11 


号 量 来 代 蔡 文件 锁 。 
在 使 用 共享 内 存 的 版 本 中 ,用 信号 量 米 保护 对 共享 内 存 的 访问 。 重 写 此 程序 ， 
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15.12 


15. 13 


用 文件 镇 来 在 代 信 和 号 量 。 当 然 这 时 需要 一 个 其 享 的 文件 。 


著 用 户 太 多 ,共享 内 疮 的 信号 量 解 决 方 案 就 无 法 报告 正确 的 结果 。 考 虚 一 下 这 
RA: 读者 A 将 读者 计数 器 增 至 1。 接 下 来 ,读者 日 将 读者 计数 器 增 至 2。 
这 时 ,读者 A 已 经 读数 据 完 毕 , 将 读者 计数 器 减 1, 但 读者 与 又 将 计数 器 增 1。 
因此 读者 计数 器 这 个 时 候 仍 为 2。 之 后 , 污 者 BB 结束 ,A 重 来 ,C AR RBM 
重 来 **。 因 此 无 论 什么 时 模 , 共 享 上 内 存 都 在 被 读 取 。 解 释 一 下 为 什么 这 种 情 
沈 阻 止 了 写 者 更 新 时 间 。 修 改 此 系统 ,使 得 写 者 可 以 防止 新 的 读者 锁 住 共享 内 
FREE . 

编写 -- 个 cp 命令 的 新 版 本 打印 机 程序 。 它 使 用 写 数 据 锁 来 防止 对 输出 文件 的 
间 步 访问 冲突 。 在 你 的 机 器 上 使 用 这 个 程序 同时 打印 两 个 文件 ， 


printcp filel /dev/lpl & printcp file2 /dew/lpl& 





